前回のアップデートが昨年9月だったこともあって、あまり情報はないのだが、今後の動向についてまとめておきたい。
まず既存の製品に関しては図のとおりで変更はない。厳密に言えば、Maxwell 1.0世代にGM108コアが存在するが、こちらはモバイル向けのローエンド製品で、GeForce 930M/940Mにのみ採用された製品、SMMの数は3つで、シェーダー数で言えば384となる。
さすがにここまでくると性能が低すぎてデスクトップには向かないと判断されたのか、OEM向けのGeForce GT 740はいまだにGK107ベースで、その上はGM107ベースのGeForce GTX 745になっており、GM208をデスクトップ向けに入れる予定は全然ないまま終わる見込みだ。
アーキテクチャーをPascalに刷新
GP100を4月のGTCで発表か?
さて、ここからは未来の話だ。今年はNVIDIAもPascalアーキテクチャーをあらゆる製品で展開する予定である。まず前回からの相違点で言えば、コード名が当初GPxxxと記していたのだが、PKxxxになるらしいと書いたのが、最新の情報ではやはりGPxxxになるようだ。ということでコード名は再びGPxxxに戻している。
Pascalが最初のお披露目になるのは、このシリーズのハイエンド製品であるGP100となる見込みだ。実はGP100を搭載したモジュールは、昨年9月に開催された2015 Taiwan GTCのディープラーニングにおける講演のスライドで公開されている。
NVIDIA TaiwanのYouTubeビデオの2分47秒あたりから、これが講演スライドの一部として表示されているのがわかる。ただし、あまり詳細に観察してほしくはなさそうでもある。
NVIDIAは、本来Maxwell 2.0となるべきであったTSMCの20nmプロセスを利用したGM104をキャンセルして28nmに戻す作業と並行して、Pascal 1.0の16FF+への実装を急いだのは間違いないし、GP100コアはかなり早いタイミングで最初のシリコンが出てきていると考えられる。
実のところ、早く出てこないとまずいという事情がNVIDIAサイドにはある。いきなり話がスーパーコンピューターに飛んでしまって恐縮なのだが、連載317回で、NVIDIAがTeslaの将来製品にNVLinkを搭載、これがIBMのCAPIと互換になっておりPower8と接続できると解説した。
このPower8+NVIDIA GPUという構成がオークリッジ国立研究所のSummitとローレンス・リバモア国立研究所のSierraに納入されることがすでに決まっている。
もう少し背景を説明すると、現在オークリッジ国立研究所にはTitanというマシンが稼働中で、これは連載302回の最後に触れた、CRAYのXE6ブレードとTesla K20を組み合わせたシステムである。
一方ローレンス・リバモア国立研究所にはSequoiaが稼働中で、これは連載306回で解説したBlue Gene/QをベースとしたASCの一部である。ただどちらも2017年には稼動後5年を経過するということで、そろそろ機材の更新時期になる。
そこでこの2つを置き換えるためのCORAL(Collaboration of Oak Ridge、Argonne、and Livermore)プロジェクトが米エネルギー省で2014年に実施された。要するにすべての研究所でそれぞれ仕様を決めて導入するのではなく、共同で仕様を策定して導入しようというものである。
日本でも筑波大と東大および京大がT2Kと呼ばれる共通仕様のスパコン導入を行なったりしたが、それのもっと大規模版というところだ。
このCORALプロジェクトに選ばれたのがIBM+NVIDIAという組み合わせで、オークリッジ国立研究所にはTitanの更新でSummitが、ローレンス・リバモア国立研究所にはSequoiaの更新でSierraが導入される。
基本構成は同じだが、Summitは300PFLOPS以上、Sierraは100PFLOPS以上の性能を出すことになっている。SummitはSierraの3倍以上のノードを集積する「予定」なわけだ。
契約によればSummitでもSierraも2017年中に設置され、2018年に稼動することになっている。それはいいのだが、問題はこのSummit/Sierraの構成はIBMの次世代プロセッサーであるPower9と、NVIDIAの次々世代GPUであるVoltaの組み合わせとなっていることだ。
もちろん実際にはいきなりPower9とVoltaを用意できるわけもないのだが、用意できるまで待ってるのも無駄だ。OSや通信関係など、開発すべきソフトウェアはインフラ側にも山とあり、アプリケーション側も当然移植作業が必要になるので、事前に開発用機材を用意する必要がある。
この開発機材として、まずはPower 8+KeplerベースのTesla(K40あたりか?)という構成のマシンがすでに少数導入されているのだが、これに加えてPower 8+Pascalという構成の機材が次に導入されることになっている。時期的にはすでに導入されているはずである。
というのはPower 8+Keplerの場合はNVLinkが利用できないため、ホストとの通信はPCI Express経由になっており、最終的な環境とかけ離れすぎている。これがPascalになると80GB/秒ではあるが(Volta世代では200GB/秒に達する)より高速な接続になるので、ライブラリー周りの開発やアプリケーションの予備評価には十分役に立つことになる。
したがって、PascalベースのGP100コアはすでに特定顧客向けに評価用の出荷がとっくに終わっている時期である。出荷していないといろいろ間に合わないことになってかなりマズいだろう。ということで、4月のGTCにはGP100は間違いなく登場すると思われる。
ただし問題は、これがデスクトップ向けとして出す余地があるかどうかである。ここでようやくロードマップに戻る。

この連載の記事
-
第852回
PC
Google最新TPU「Ironwood」は前世代比4.7倍の性能向上かつ160Wの低消費電力で圧倒的省エネを実現 -
第851回
PC
Instinct MI400/MI500登場でAI/HPC向けGPUはどう変わる? CoWoS-L採用の詳細も判明 AMD GPUロードマップ -
第850回
デジタル
Zen 6+Zen 6c、そしてZen 7へ! EPYCは256コアへ向かう AMD CPUロードマップ -
第849回
PC
d-MatrixのAIプロセッサーCorsairはNVIDIA GB200に匹敵する性能を600Wの消費電力で実現 -
第848回
PC
消えたTofinoの残響 Intel IPU E2200がつなぐイーサネットの未来 -
第847回
PC
国産プロセッサーのPEZY-SC4sが消費電力わずか212Wで高効率99.2%を記録! 次世代省電力チップの決定版に王手 -
第846回
PC
Eコア288基の次世代Xeon「Clearwater Forest」に見る効率設計の極意 インテル CPUロードマップ -
第845回
PC
最大256MB共有キャッシュ対応で大規模処理も快適! Cuzcoが実現する高性能・拡張自在なRISC-Vプロセッサーの秘密 -
第844回
PC
耐量子暗号対応でセキュリティ強化! IBMのPower11が叶えた高信頼性と高速AI推論 -
第843回
PC
NVIDIAとインテルの協業発表によりGB10のCPUをx86に置き換えた新世代AIチップが登場する? -
第842回
PC
双方向8Tbps伝送の次世代光インターコネクト! AyarLabsのTeraPHYがもたらす革新的光通信の詳細 - この連載の一覧へ











