本題に移る前に、連載607回の補足を。AVXの無効化で消費電力が大幅減の項目で、リアルタイムにAVXの有効化/無効化の制御ができる、という話を紹介した。その後インテルより正式な回答として以下の返答が届いた。
「AVXの無効化機能については、リリース版では再起動を必要とする仕様で固まりました。また、AVXの無効化機能は、オーバークロック上級者向けの機能です。AVXを使用しているアプリケーションについては、実行前にチェックし実行できないようにしますが、すべてのアプリケーションでチェックがかかるわけではないため、あくまで上級者向けの機能とご理解ください。」
やはりダイナミックにAVXの有効化/無効化を許すのは危険すぎると判断されたようだ。したがって、オーバークロックツールからこれを設定しても、再起動するまで反映されないようだ。将来のBIOS更新で、BIOS設定にこの機能が追加されることになるかもしれない。
ちなみに回答の後半の意味は「AVXを有効化/無効化すると、これにあわせてCPUID Flagの当該bitがOn/Offするので、これで現状AVXが有効か否かを判断できる」ということである。通常AVXを利用するアプリケーションはこれを利用してAVXが使えるかどうか判断するので、その意味ではごく穏当な実装になったと言える。
パラレルプロセッシングの製品開発を目指して起業したAdaptive
ということで本題に入ろう。今回のAIプロセッサーはAdaptivaのEpiphanyをご紹介したい。実はこのAdaptiveのEpiphanyを搭載したParalleraという開発ボード、国内ではRS Componentsが代理店になって販売していたこともあり、2014年にASCII.jpで記事が挙がっているので、ひょっとすると記憶の片隅に残っている読者もおられるかもしれない。ちなみに筆者はKickstart経由でAdaptivaに出資しており、やはりParalleraボードを所有していたりする。
Adaptivaという会社は2008年に設立された。創業者はAndreas Olofsson氏。1997年にペンシルバニア大で修士を取った後でTIを経てADI(Analog Devices Inc.)で10年あまり勤務。最後は同社のRISCプロセッサー(TigarSharcやBlackfinなどの汎用品ではなく、ASIC向けカスタムRISCという話だった)のシニアアーキテクトを務めていたそうだ。そのADIを辞して起こしたのがAdaptivaという会社である。
Adaptivaが、というかOlofsson氏が志向したのはパラレルプロセッシングである。今でこそPCのCPUが16コアだの32コアだのと極端にインフレを起こしているし、もっと言ってしまえばGPUなんて数千コアで構成されているわけでパラレルプロセッシングにはさして違和感はないが、2008年当時と言えば「いずれはパラレルプロセッシングになる」とは言われつつも、まだそこまで思い切ったプロセッサーは出てこなかった。
一方でOlofsson氏がADIで最後に携わっていたのが、ASIC向けRISCプロセッサーというのは象徴的である。実はASICといってもいろいろで、カスタム回路を大量に突っ込んで、制御用にCPUを1つ2つというケースもあるが、そのカスタム回路を起こす代わりに多数のCPUを突っ込み、それぞれに専用処理をひたすらやらせるという実装もしばしばある。
これなら個々のCPUは必ずしも高性能である必要はなく、一方でチップとしての実体は1つなので、複数のCPUチップを基板上に並べるよりも省電力かつ低コストで実現できる。おまけに、後で仕様に変更があっても対処しやすい、といいことづくめだ(*1)。
(*1) 言い過ぎです。
おそらくではあるが、Olofsson氏がADI時代の最後に経験したのは、こうしたチップの開発だったのだろう。そして、それをもっと汎用的に提供したいというのがAdaptivaの目的であった。
さてAdaptiva設立後、Olofsson氏はまずシミュレーター上で動く16コアの最初のプロトタイプ(Epiphany-0)を開発。これをベースに2009年には動作するプロトタイプとしてEpiphany-Iを開発。これをベースに、2010年には同じく16コアのEpiphany-IIを開発。このEpiphany-IIをベースにした製品が、2010年に登場したEpiphany-IIIである。
ちなみにEpiphany-I~Epiphany-IIIはすべて65nmプロセスで製造されており、Epiphany-1の開発に20万ドル、Epiphany-IIの開発には150万ドルほどかかっており、続くEpiphany-IIIは開発コストこそゼロ(Epiphany-IIをベースにしたためと思われる)なものの、その次として狙っていたEpiphany-IVの開発コストが50万ドルほどかかった時点で同社の資金がいろいろ厳しくなってきており、設計こそ終わったものの量産する資金が不足していた。
そもそもEpiphany-IIIにしてもEpiphany-IVにしても、この時点で大口顧客を捕まえられなかったのが同社にとっていろいろ致命的であった。Epiphany-IIIは製品クオリティーではあるものの、製造プロセスが65nmとわりと古かった。
例えばTSMCは2006年に65nmの量産をスタートしており、2008年にはすでに45nmの量産を開始している。この45nmはいろいろ問題があって広くは使われなかったが、続く40nmは2009年から広く利用されており、2011年には28nmの量産がスタートしている(本格量産は2012年から)。
つまりEpiphany-IIIはもうこの時点で2世代遅れの製品であり、競争力に欠けていた。それもあってEpiphany-IVでは28nm(最終的にGlobalfoundriesの28nmを利用)で製造して競争力を高めることで顧客を掴みたいと考えたわけだが、その前に資金が尽きた格好だ。

この連載の記事
-
第852回
PC
Google最新TPU「Ironwood」は前世代比4.7倍の性能向上かつ160Wの低消費電力で圧倒的省エネを実現 -
第851回
PC
Instinct MI400/MI500登場でAI/HPC向けGPUはどう変わる? CoWoS-L採用の詳細も判明 AMD GPUロードマップ -
第850回
デジタル
Zen 6+Zen 6c、そしてZen 7へ! EPYCは256コアへ向かう AMD CPUロードマップ -
第849回
PC
d-MatrixのAIプロセッサーCorsairはNVIDIA GB200に匹敵する性能を600Wの消費電力で実現 -
第848回
PC
消えたTofinoの残響 Intel IPU E2200がつなぐイーサネットの未来 -
第847回
PC
国産プロセッサーのPEZY-SC4sが消費電力わずか212Wで高効率99.2%を記録! 次世代省電力チップの決定版に王手 -
第846回
PC
Eコア288基の次世代Xeon「Clearwater Forest」に見る効率設計の極意 インテル CPUロードマップ -
第845回
PC
最大256MB共有キャッシュ対応で大規模処理も快適! Cuzcoが実現する高性能・拡張自在なRISC-Vプロセッサーの秘密 -
第844回
PC
耐量子暗号対応でセキュリティ強化! IBMのPower11が叶えた高信頼性と高速AI推論 -
第843回
PC
NVIDIAとインテルの協業発表によりGB10のCPUをx86に置き換えた新世代AIチップが登場する? -
第842回
PC
双方向8Tbps伝送の次世代光インターコネクト! AyarLabsのTeraPHYがもたらす革新的光通信の詳細 - この連載の一覧へ













