CEDEC 2011レポート
スパッと解る、2018年までのコンピューター進化のシナリオ
後藤弘茂氏によるゲームハードウェアのトレンド予想
PC Watchでおなじみのテクニカルジャーナリスト 後藤弘茂氏 |
2018年のハードウェアを大胆予想 |
CEDEC 2011の会期最終日、近未来のゲームハードウェア進化を大胆に予想するセッションが行なわれた。講演を行なったのは姉妹誌PC Watchでおなじみのテクニカルジャーナリスト後藤弘茂氏。半導体技術の最先端をつぶさに追いかける後藤氏ならではの、鋭く説得力に溢れた未来図予想が披露された。
「2018年までのゲームハードウェアトレンド」と題するこのセッションの冒頭、後藤氏は2018年という時期を題材とした理由として「半導体産業がゴールを設定した鍵となる年であり、予想がしやすい」という事情を語った。業界的な目標として、2018年頃に1エクサFLOPSの能力を持つスーパーコンピューターの実現が設定されているという。それに向けて現在、ハード・ソフト面での様々な研究開発が進められているというわけだ。
そして後藤氏は、その頃にはスーパーコンピューターからモバイル端末まで、コンピューターアーキテクチャがほぼ同じものになると予想する。この予想にはきちんと理由があるが、まずこれを前提とすると、ワット当たりの処理能力は上から下まで同じような比を持つようになる。後藤氏は、2018年頃のスマートフォンは100ギガFLOPSオーダー、PCやゲーム機は10テラFLOPSオーダーの処理能力を持つことになるだろうとして、本題の話を起こした。
■ スパコンからスマートフォンまで、プロセッサはヘテロジニアスに向かう!
2018年までのプロセッサトレンド概要 |
原因は半導体技術にある |
ダークシリコン問題 |
2018年に向けてのプロセッサアーキテクチャー上の流れとしては、多くのプロセッサがゲームの実行に適する、並列処理性能に優れたものになっていく。そして、現在のゲーム機のように、ゲーム用途だけに特化したアーキテクチャは過去のものになるかもしれないという。その原因は半導体技術にある。コア当たりの処理能力をこれ以上向上させることが物理的に困難になった結果、並列処理性能を高める方向に進化せざるを得ないのだ。
後藤氏はこれを明確化するために、これまでプロセッサの進化を支えてきたプロセスルールの微細化について解説した。ポイントをまとめると、130nmまでは、微細化が1世代進むたびに、単位電力あたりの性能は2倍程度に伸びてきた。しかし90nm以降は、トランジスタの構成要素が原子レベルまで微細化したために、スケールダウンの限界が来てしまった。
量子的なふるまいが無視できないスケールに突入したことで従来の法則は通用しなくなり、電力効率の向上ペースが大幅に鈍化した。同じ面積のチップに載せられる面積が倍増しても、電力や発熱の制限のため、チップ上の一部しか回路に使用できないという「ダークシリコン」と呼ばれる問題も発生している。
微細化による高性能化の今昔。現在は限界に到達しつつある |
ヘテロジニアスコンピューティング |
ヘテロジニアスなワンチップシステムの模式図 |
2018年のハイエンドチップ予想 |
こういった理由のため近年のプロセッサではマルチコア化で性能を上げることがトレンドとなっている。しかし、単にコア数を増やしても、それを利用するソフトウェアアルゴリズムに並列化できない部分が少しでもあれば、全体のパフォーマンスがなかなか上がらないという問題もある。
こういった問題を完全解決するまではいかないものの、ベストなバランスを取りうる手法として立ち上がってきたのが「ヘテロジニアスコンピューティング」だ。高性能のCPUコアと、並列処理に優れたスモールコア群でコンピューターを構成するアプローチである。ちなみに、この言葉が最初にクローズアップされたのはPS3に使われているCellプロセッサができたころだという。
ゲーム業界が最初の試練の場となったヘテロジニアスコンピューティングの流れは、高性能GPUを搭載したPCという形で市井に浸透しつつ、電力効率への要求が厳しいスマートフォン分野にも急速に波及している。後藤氏はいくつかの実例を挙げつつ、今後の流れとして、さらなる電力効率の達成のためCPUコアとGPUコアの統合が進められている事情を紹介した。
そこで鍵のひとつとなるのは、ストリームプロセッサであるGPU側で、より粒度の細かいタスクを扱えるようになることや、複数コンテクストの並列実行が可能になることだという。そうなれば従来CPUに任されていたタスクをGPUで処理できるようになったり、グラフィックス処理をしながら汎用処理もやる、という柔軟な運用が可能になる。ゲームでGPGPUを本格利用するためには必須であるとも言える。
やがてはCPUとGPUを意識せずに扱えるプログラミングモデルが構築されることがひとつのゴールというが、GPUのインストラクションが複雑化することで電力効率が下がるという問題も指摘。この点は、前述した「ダークシリコン」問題で余っているシリコンを利用し、よく使われる処理をハードウェア実装するというアプローチが解決策のひとつとなるようだ。将来のプロセッサはCPU/GPUの負担をオフロードする「オフロードエンジン」を多数備えることになりそうだとも予測している。
コア数を増やすモチベーションのひとつ「ポラックの法則」。CPUを大きくしても性能はその平方根ペースでしか伸びないが、コア数を増やせば正比例して伸びるポテンシャルがある | ||
グラフィックス用途として普及してきたGPUが高性能化することで、ヘテロジニアスコンピューティングの基礎が急速に固められつつある。今後はCPUとGPUの統合が課題となる |
■ メモリ帯域がぜんぜん足りない! 半導体業界の対応とは?
メモリ帯域が足りない問題 |
GPUは帯域問題を回避するように進化してきた |
新方式の登場で帯域問題に一定の解決が見られるか? |
ヘテロジニアスアーキテクチャの追求によりロジックの処理速度が向上するにつれて、大問題として立ち上がってきたのが「メモリ帯域が足りない」問題だという。プロセッサは2年で最大2倍コアになる一方、DRAMの転送レートが2倍になるのには3~4年かかるというのがその原因だ。
このためGPUは高速な内部メモリをうまく使うアーキテクチャに以降することでボトルネックを緩和する方向に進んでいるが、根本的な解決とはいえない。そこで、メモリ高速化のためのいくつかの手法が浮上してきている。
ひとつは「広くて遅いメモリ」。「Wide I/O」規格のDDRメモリが当面の有望株である。TSV(シリコン貫通ビア)と呼ばれる半導体技術がベースとなっており、DRAMとプロセッサを重ねるような形で立体的につなぐことで、従来方法では実現できなかった非常に大きなバス幅を実現するものだ。
TSVでは従来手法より圧倒的に広いバス幅を実現でき、メモリ帯域を一気に引きあげることができる。最終的にはテラバイト/秒クラスの帯域を今までと同じ消費電力で実現することがゴールになっているという。問題は製造の難しさと歩留まりの悪さ。一般に普及できるようになる時期は「今すぐ」から「5年後」までと、人によって幅広く諸説あるようだ。
また、後藤氏はDRAM終焉後の「ポストDRAM」についても解説を展開した。微細化が限界に達するDRAMに変わる存在として有望視されているのは、DRAM並みの性能を持ちながら、フラッシュメモリの不揮発性特質も持つ新型のメモリだという。
実現されればメモリ保持のための電力が劇的に下がることになる。また、CPUのコンテキストスイッチ処理が根本的に変わる、システムメモリとストレージクラスメモリが統合されるなどにより、「新しいランドスケープが見えてくる」というのが後藤氏の予想だ。
メモリの使い方も根本的に変わる。例えば、コードが実行されているところにデータを持っていくのではなく、データのあるところにコードを持っていくという手法だ。将来のコンピューティングではますますメモリの遅さが重大なボトルネックになることから、非常に効果が期待される手法である。後藤氏によれば実際に、別々の半導体企業に所属する複数の研究者が、一様にこの手法に注目していたという。
メモリの高速化について。立体的にDRAMを積層する方式を解説 |
■ ヘテロジニアスのもたらすものとは。アプリケーションはどう変わる?
ヘテロジニアス化によるソフトウェアの変化 |
CPUとGPUを区別せずに並列プログラミングを可能とする新しい標準の登場が期待されている |
全く新種のアルゴリズムの開発も鍵となる |
コンピューターのアーキテクチャがいくつかの高性能プロセッサ+多数のスモールプロセッサという構成に進む中で、当然ながらソフトウェアアプリケーションのあり方にも変化が訪れる。
グラフィックス以外の分野でも膨大なデータ処理が可能となることで、大きな影響を受けると後藤氏が考えているのがユーザーインターフェイス分野だ。コンピューターサイエンスの分野で研究が進んでいるRMS(認識、分析&抽出、合成)という、コンピューターが人間と同じように世界を捉えるアプローチが実用可能となることがひとつのポイントだ。
この能力をコンピューターが獲得することにより、人間とコンピューターのインタラクションはより容易で自然なものになる。コンピューターが世界とインタラクションする方法も多様化するだろう。当然、人工知能の分野でも、飛躍的な進歩が見られるようになりそうだ。これにより、ゲーム業界でも様々な新発想が生まれることだろう。
ただし、ヘテロジニアスなコンピューターを前提としたプログラミングは、並列処理をうまく記述する必要上、従来よりも複雑化することになる。それを助けるための言語系の登場が、ゲーム開発が先に進むためのもうひとつのポイントといえそうだ。そのためのアーキテクチャ上の仕組み例のひとつとして、後藤氏はトランザクショナルメモリを挙げている。メモリへの同時アクセスにまつわる問題を根本的に解消する技術だ。
メモリといえば、根本的な面で考えるべきこともある。前述したようにメモリの帯域が足りない問題は当面続くようであるため、「データを移動させないコンピューティング」に基づいた手法の開発が、ソフトウェアエンジニアリング上の重要なテーマとなるようだ。
2018年までにはワンチップに数千コアが当たり前になるという後藤氏。ヘテロジニアス化が進み、CPUコアとGPUコアの統合がより密接になっていく。後藤氏は、ゲームはますますプロセッサアーキテクチャの変化を意識しなければならないと指摘しつつ「その先は皆さんでがんばってください」と話し、ニコリと笑った。
後藤氏が予想するように、ゲーム業界にはこれからも技術面で様々なチャレンジが訪れることだろう。しかし、それ自体が成長の原動力にもなるはずである。ヘテロジニアスコンピューティングのその先に、どんなエンターテイメントが実現されるだろうか。10テラフロップス級のゲーム機やPCで、どんなすごいゲームが遊べるようになるだろうか。想像を刺激し、思わず胸が躍るような講演だった。
プロセス技術の今後について。当面、微細化を推し進める上で「ワンポイントリリーフ」として期待されているのが3Dトランジスタ技術。ただこの技術は、微細化を1段階深める役に立つだけで、根本解決にはつながらないという。別のアプローチとしては、TSV技術の発展による半導体の立体化というものが予想されている |
□コンピュータエンターテインメント協会(CESA)のホームページ
http://www.cesa.or.jp/
□「コンピュータエンターテインメントデベロッパーズカンファレンス2011(CEDEC 2011)」のページ
http://cedec.cesa.or.jp/2011/
(2011年9月9日)