SoCタイルは省電力性を最大限に生かす設計
では、そのMeteor Lakeの構造である。内部構造の推定は連載720回でお届けしたが、おおむね米国で特許出願した際の構造に近いものとなった。
ただこの図ではコンピュート・タイルはPコア×2+Eコア×8であるが、今回説明されたものはPコア×6+Eコア×8の構成であり、またIOタイルも存在する。これはいわばSKU次第であって、ローエンド向けにはPコア×2+Eコア×8でIOタイルなしのものもあるかもしれない。
また連載720回では4次キャッシュの存在の可能性について論じたが、少なくとも現時点では4次キャッシュに関しての言及がまったくない。
ただし大きな違いはSoCタイルに搭載されている2コアのEコアである。筆者はこの2コアのEコアを「セキュリティ制御専用と言うよりは、SoC側のもろもろの処理をCPUタイル上のCPU Complexを動かすことなく行なえるようにしよう、ということのようだ。」と書いたが、間違ってはいないものの正確ではなかった。
確かにブートの際にはセキュアブートなどの処理のために利用されるのだろうが、OSの起動後はこのSoCタイルのEコアもまたOSの管理下に置かれることになる。つまりMeteor LakeのCPUコアはPコア×6+Eコア×10になる。
もっともここからがMeteor Lakeの大きな特徴である。ハードウェア的に言えばコンピュート・タイルのEコアもSoCタイルのEコアも同じCrestmontコアであるが、コンピュート・タイルの方はIntel 4プロセスで「最大のマルチスレッド性能」を発揮するように実装されているのに対し、SoCタイルの方はTSMC N6で省電力性を最大限に生かすような実装になっている。
要するに物理設計におけるPPA(Power, Performance and Area)のターゲットが、コンピュート・タイルの方はやや高性能寄りになっているのに対し、SoCタイルの方は省電力/省エリアサイズに振った形になっている。この結果として、それぞれのコアの性能は見事にばらけることになる。
ではこれをどうやって制御するかであるが、スレッド・ディレクターにずいぶん手が入った。下の画像がその模式図である。基本CreateThread()やpthread_create()などで生成されたスレッドは、親スレッドと同じプロセッサーコア上で稼働しそうな気もするのだが確証はない。
Alder Lake/Raptor Lakeでは、テーブルの登録に応じてPコアないしEコアに処理が割り当てられ、その後も監視しながら負荷が低いものはEコアに、負荷が高いものはPコアに移行する形で負荷分散を図っているのが原則である。
これに対して、Meteor Lakeではまずすべての処理はSoCタイルのEコアで動かし、ここで負荷が大きい場合はコンピュート・タイルのEコアに移行させ、それでも足りなければPコアに移行する。
この結果として、例えばOSのタスク類は常にSoCタイルのEコアで動き、コンピュート・タイルのEコア/Pコアはアプリケーションの処理に割り当てられる、というのはインテルの説明である。
連載735回で、Meteor LakeのDVFS(Dynamic Voltage and Frequency Scaling)にはAIが利用されていると説明した。おそらくはAIを利用してタスクをIdle/Fixed QoS/Sustained/Burstyに分類、それぞれの特徴に応じて動作周波数や電圧の制御を行なうというものだが、これは単にDVFSだけでなくスレッド・ディレクターでも活用されていると考えられる。
OSのタスクはFixed QoSあたりに分類され、基本はSoC Eコアで。そしてアプリケーションの処理はSustained/Burstyに分類され、コンピュート・タイルのEコアやPコアに推移すると思われる。
思うに、まずSoCタイルのEコアで動かすのは、そのEコアでの稼働中に動作状態のサンプルを取り、そのサンプルを基にタスクの種類をAIを使って判断するためと考えられる。
ただ別の見方をすると、Alder Lakeの時に説明された「省電力のEコアとパフォーマンスのPコア」という分類は、Raptor Lakeの時点でだいぶ怪しかった(*1)が、Meteor Lakeでは省電力なのはSoCタイルのEコアのみで、コンピュート・タイルのEコアは“Efficient MT performance”を実現するあたりは、それなりに動作周波数が引きあがるものと考えられる。
もっともMeteor Lake、現在のパッケージがモバイル向けのみなので、最大でもH SKUの45~65Wで、メインはP SKUの28~35Wレンジになるだろうと考えると、どこまで動作周波数が積みあがるのかはわからない。
(*1) フル稼働時はEコアも限界までぶん回すことでマルチスレッド性能を引き上げるという実装になり、結果としてRaptor Lakeを爆熱CPUに仕立て上げた。

この連載の記事
-
第852回
PC
Google最新TPU「Ironwood」は前世代比4.7倍の性能向上かつ160Wの低消費電力で圧倒的省エネを実現 -
第851回
PC
Instinct MI400/MI500登場でAI/HPC向けGPUはどう変わる? CoWoS-L採用の詳細も判明 AMD GPUロードマップ -
第850回
デジタル
Zen 6+Zen 6c、そしてZen 7へ! EPYCは256コアへ向かう AMD CPUロードマップ -
第849回
PC
d-MatrixのAIプロセッサーCorsairはNVIDIA GB200に匹敵する性能を600Wの消費電力で実現 -
第848回
PC
消えたTofinoの残響 Intel IPU E2200がつなぐイーサネットの未来 -
第847回
PC
国産プロセッサーのPEZY-SC4sが消費電力わずか212Wで高効率99.2%を記録! 次世代省電力チップの決定版に王手 -
第846回
PC
Eコア288基の次世代Xeon「Clearwater Forest」に見る効率設計の極意 インテル CPUロードマップ -
第845回
PC
最大256MB共有キャッシュ対応で大規模処理も快適! Cuzcoが実現する高性能・拡張自在なRISC-Vプロセッサーの秘密 -
第844回
PC
耐量子暗号対応でセキュリティ強化! IBMのPower11が叶えた高信頼性と高速AI推論 -
第843回
PC
NVIDIAとインテルの協業発表によりGB10のCPUをx86に置き換えた新世代AIチップが登場する? -
第842回
PC
双方向8Tbps伝送の次世代光インターコネクト! AyarLabsのTeraPHYがもたらす革新的光通信の詳細 - この連載の一覧へ















