今回のAIプロセッサーの昨今は、8月に開催されたHot Chips 32でAlibaba Groupが発表したHanguang 800シリーズを紹介する。
メガプラットフォーマーが自前でプロセッサーを
用意するのは当たり前の時代になった
いきなり余談だが、Alibaba GroupはHotChips 32で3件の発表を行なっている。1 つがこれであるが、他にAlibaba CloudによるX-Dragonというクラウドプラットフォーム用SoC、それとAlibaba Groupのファブレス半導体メーカーであるT-HEADによるXuantie-910というRISC-Vベースのプロセッサーである。
最近GAFA+BATH(Baidu・Alibaba・Tensent・Huawei)などという言葉も流行っているが、Alibabaはもう立派なメガプラットフォーマーであり、こうなってくると機械学習に特化したGoogleの自社開発プロセッサーであるGoogle TPUと同じように「自社専用でプロセッサーを作っても、十分ペイできる」という状況が発生する。
Google TPUは一部市販などもされているが、Hanguang 800シリーズはAlibaba Group内での利用に留まっており、それでも開発費や生産コストで十分元が取れるという、ここまで紹介してきたAIチップ(Google TPUを除く)とはやや様相の異なるビジネスモデルが成立している格好だ。
さらに余談になるが、今回Hanguang 800の説明はAlibaba Groupとして開催されたが、チップの開発そのものはXuantie-910と同じくAlibaba子会社のT-Head(Pingtouge Semiconductor、平?哥半?体有限公司)で行なわれている。
これはHuaweiの半導体が、実際にはHuawei子会社のHiSiliconで設計・製造されているのと同じような図式である。実際T-Headのウェブサイトでは、Hanguang 800が並んで掲載されていたりする。
こうした話は別にBATHだけではない。AWS(Amazon Web Services)も、インテルやAMD、NVIDIAのCPU/GPUを利用したインスタンスを立ち上げる一方で、イスラエルのファブレスCPUメーカーだったAnnapurna Labを2015年に買収。ここで設計・製造したGraviton/Graviton 2プロセッサーをAWSで採用しており、さらに2018年には推論専用チップとしてAWS Inferentiaを2018年に発表、2019年からこれを利用したサービスを始めている。
今年、AWSが開いたre:inventというイベントでは、学習用チップとしてTrainiumという新しいプロセッサーを発表しており、2021年中に利用可能状態になるとする。もうメガプラットフォーマーは、自分でプロセッサーを用意するのが当たり前の時代になりつつあるわけだ。
性能より総保有コストを最優先に設計された
Hanguang 800
ということで話をHanguang 800に戻そう。Hanguang 800そのものは2019年に発表はされていたが、Hot Chips 32で詳細が明らかになった。そのHanguang 800の設計目標が下の画像だ。
Hanguang 800の設計目標。まずTCO(Total Cost of Ownership:総保有コスト)が最優先で、次にCNN(畳み込みニューラルネットワーク)の高速化、最後にプログラミングしやすさが来るという、ある意味わかりやすい目標
TCOといっても、設計・製造コストや廃棄コストはそんなに他の製品と大きくは変わらないので、必然的に性能/消費電力比が一番重要になる。実際、稼働中の消費電力が一番コストに効いてくるからだ。また利用できる処理もある意味割り切った。
AIでは新しい技術がかなり頻繁に登場するため、ある程度演算器の構成などに柔軟性を持たせることで今後登場する技術にも対応できるようにする配慮が必要であるが、Hanguang 800はある意味「設計時点で見えている技術に最適化する」という、割り切った構成になっている。

この連載の記事
-
第852回
PC
Google最新TPU「Ironwood」は前世代比4.7倍の性能向上かつ160Wの低消費電力で圧倒的省エネを実現 -
第851回
PC
Instinct MI400/MI500登場でAI/HPC向けGPUはどう変わる? CoWoS-L採用の詳細も判明 AMD GPUロードマップ -
第850回
デジタル
Zen 6+Zen 6c、そしてZen 7へ! EPYCは256コアへ向かう AMD CPUロードマップ -
第849回
PC
d-MatrixのAIプロセッサーCorsairはNVIDIA GB200に匹敵する性能を600Wの消費電力で実現 -
第848回
PC
消えたTofinoの残響 Intel IPU E2200がつなぐイーサネットの未来 -
第847回
PC
国産プロセッサーのPEZY-SC4sが消費電力わずか212Wで高効率99.2%を記録! 次世代省電力チップの決定版に王手 -
第846回
PC
Eコア288基の次世代Xeon「Clearwater Forest」に見る効率設計の極意 インテル CPUロードマップ -
第845回
PC
最大256MB共有キャッシュ対応で大規模処理も快適! Cuzcoが実現する高性能・拡張自在なRISC-Vプロセッサーの秘密 -
第844回
PC
耐量子暗号対応でセキュリティ強化! IBMのPower11が叶えた高信頼性と高速AI推論 -
第843回
PC
NVIDIAとインテルの協業発表によりGB10のCPUをx86に置き換えた新世代AIチップが登場する? -
第842回
PC
双方向8Tbps伝送の次世代光インターコネクト! AyarLabsのTeraPHYがもたらす革新的光通信の詳細 - この連載の一覧へ













