【特別企画】

テクニカルジャーナリスト後藤弘茂氏が語るプロセッサ技術トレンド

最新技術情報を踏まえ、次世代機のスペック予想をアップデート!

【CEDEC 2019】

9月4日~6日開催

会場:パシフィコ横浜

 CEDEC2019最終日の9月6日、僚誌PC Watchの連載「後藤弘茂のWeekly海外ニュース」でおなじみの後藤弘茂氏が、コンピュータハードウェア技術トレンドをテーマにした講演を行なった。後藤氏の講演内容は、プロセッサ関連技術において、まさに同連載のダイジェストでありながら、かなりの広範囲を網羅したものだ。

 本講演の内容は、垂直方向にも水平方向にも細分化されたモダンなゲーム開発において、プロセッサの振る舞いを意識したコードを書く必要に迫られるプログラマの絶対数は決して多くないことから、幅広い層のゲーム開発に直接役立つものではないが、後藤氏独特の語り口で披露されるトレンドの数々は、純粋に知的好奇心を満たすものとして大変興味深い。

 本項では、ディープでマニアックな部分を含めて、ゲームプレイ環境に関心を持つゲーマーに向けて本講演のトピックを紹介する。加えて、筆者が、5月6月に、それぞれ行なった次世代コンソールゲーム機の予想を、TGS開催を目前に控えた今、改めて行なってみたい。

フリーのテクニカルジャーナリスト後藤弘茂氏

大いに“タダ飯”を貪った“ムーアの法則”時代

 “チップ上のトランジスタ数は約2年ごとに2倍になる”。――半導体業界が長く達成し続け、近年は鈍化しつつあり、そしてついに終焉を迎える時が迫っている“ムーアの法則”は、プロセッサに興味を持つ者なら誰もが知るところだろう。そもそも“法則”といっても、“ムーアの法則”の場合は、一定限の普遍性を持つと仮定できる自然科学の“法則”と比較すると、もっとゆるい、どちらかというと経験則の部類で、実のところマーフィーの法則と大して変わらないものだ。

 だからと言って意味がないとか、容易に例外が起こりうるということではなく、実際過去50年以上もの間、この“ムーアの法則”を指標値として、半導体性能を向上させる努力が続けられてきたという意義を持つ。

【SIGGRAPH2019 Intelカンファレンスより】
1965年Electronics誌Vol.8における“ムーアの法則”のオリジナル
“ムーアの法則”50年の軌跡

 後藤氏の解説によると、この“ムーアの法則”は“経済則”であり、初期投資コストに見合うリターンが得られず、経済的合理性を失った瞬間に破綻するのだという。チップに形成するトランジスタを増やす方法は、チップのサイズを大きくするか、トランジスタのサイズを小さくするか、その両方をやるか、ということになる。

 仮に、チップのサイズを大きくして2倍を達成するとなると、初期投資は必要ないとしても原材料費が2倍必要になり、製造コストがリニアに増えることから、この方法は採用できない。一方で、トランジスタのサイズを小さくして2倍にする、つまりプロセスルールの微細化による場合には、微細化のための初期投資が必要なものの、原材料費は変わらない。

【プロセッサ技術トレンド】

 厳密にいうと“ムーアの法則”は、トランジスタ数増加による性能向上には言及していないが、ここに“デナード則”と“ポラックの法則”を考え合わせると、同一のチップ面積に2倍のトランジスタ数を形成する微細化が達成できれば2倍の性能になる。よって“ムーアの法則”は、“プロセッサの性能は約2年で2倍になる”という理解でも、そう大きな間違いではなかった。

 2000年から2006年にかけて、180nmに始まり、130nm、90nmを経て最終的に65nmまで微細化されたIntel「Pentium4」までは、微細化によって、高密度、低電圧、高クロックを実現して性能を向上させていたため、原材料コスト的には何の問題もなかった。“タダ飯”(Free Lunch / 無料の昼食)というのはやや極論ではあるが、その後のあの手この手の高性能化のための方法論と比較して、ほぼ微細化に注力していれば良かった時代は、今よりはるかに低い初期投資コストであったことは間違いない。

【微細化プロセス技術】

 ただし、この「Pentium4」微細化の過程で、性能向上を阻害する高い壁が立ちはだかった。リーク電流の問題だ。リーク電流が発生すると誤作動を引き起こしたり、消費電力が上昇して発熱につながる。プロセッサが常に発熱していると、同じく発熱要因である高クロック動作は望めないことから、結果的に性能向上は頭打ちになる。

 以降の微細化による性能向上は、常にこのリーク電流との戦いだといっていい。高クロック化をほどほどに、「Core」プロセッサの登場以降マルチコアでのトータルの性能向上に方向転換するも、リーク電流対策として、回路設計上あえて動作の“間引き”を行って、最大性能を犠牲にしてでも消費電力の抑制を優先しなければならないところまできている。

【“ムーアの法則”を阻む問題点】

 そればかりか、微細化によって如何に多くのトランジスタを形成したところで、リーク電流を抑えきれず消費電力が下がらないことから、最近ではプロセッサ全体に同時に給電できない“ダークシリコン”問題が顕在化し始めている。動作させられないのならば、もはや何のための微細化で、何のためにそれほど多数のコアを搭載するのか分からなくなってしまう。

 これが“ムーアの法則”の終焉を迎えつつあるプロセッサの抱える大きな課題で、PCのみならず、スマホやコンソールハードであっても、同じ問題を抱えている。

【“ムーアの法則”を阻む問題点】

【SIGGRAPH2019 Intelカンファレンスより】
“コンピュータのクラス群の誕生と死についてのベルの法則”

きっちり“飯代”を支払うポスト“ムーアの法則”時代

 さて、みんなで“タダ飯”を喰らいこの世の春を謳歌した“ムーアの法則”時代とは大きく異なり、さらなる微細化を実現するために、多大なコストを支払わなければならなくなった現在、プロセッサの性能向上のためにどのような施策が採られているのだろうか。

【SIGGRAPH 2019 Intelカンファレンスより】
CES2019で「ムーアの法則は死んだ」としたNVIDIA CEOのJensen Huangと2018 IEEE Spectrumで「ムーアの法則は終わった」としたGoogleのDavid Patterson

 後藤氏は、大きく分けて3つのポイントを挙げていた。ひとつは、回路設計の工夫で、製造プロセスの微細化のみに頼らないで、スタンダードセルと呼ばれるロジックパターンの各ブロックを見直してトランジスタ密度を向上させる方法論だ。よくよく考えれば、かつての回路に手を加えなくても精度の高い縮図をシリコンウェハーに形成することさえできれば良かった時代の方がむしろ例外で、わずかでも高密度になるように回路に改良を加え続ける方が至極真っ当に思える。

【回路設計の刷新】

 ふたつ目はマルチダイ設計で、発想的には特段新しいものではなく、マルチコアでAMDに遅れをとったインテルが早期製品リリースのために「Pentium D/XE」で採用した方策と根源的に変わりはない。現世代のプロセッサでは、チップレットと呼ばれるマルチコアなダイをパッケージに複数封入したAMDのZen2アーキテクチャが典型例だと言える。SIEやMSの次世代機では、このチップレットの一部がGPUやRTの役割を担うものになり、APU化したものが搭載されるだろう。

 この分野では、技術的課題はまだまだ多いものの、2階建、3階建と垂直方向に積層化することでプロセッサのレイヤー間の電送路を短絡に保ちながら、トランジスタを飛躍的に増加させる手段が残っており、かなり伸び代が大きい。

【マルチダイ設計】

 3つ目のポイントは、プロセッサアーキテクチャの進化で、なかでもゲーマーにとって関心が深いのは、特定ドメインに特化したアーキテクチャだろう。具体的には、NVIDIAのRTXシリーズのように、従来のGPUに相当するコアに加えて、AIに特化したTensorコア、レイトレースに特化したRTコアを加えるといったアプローチを指す。

 AMDのRadeonの場合、Tensorコアに相当するものはなく、AIに関しては既存の演算ユニットの精度が“大は小を兼ねる”ものであることから、これらでまかなっていく方向性が堅持されるだろう。E3で発表された次世代Navi(RDNA)アーキテクチャの方向性から言っても、RDNA2でRTコアは追加されるものの、Tensorコアに相当するものを追加してNVIDIAのアプローチを完全にトレースしていくことはない。

【アーキテクチャの進化】

 意外だったのは、QualcommのSnapdragonのようなスマートフォン向けSoC(System on a chip、APUをさらに発展させて、システムの大部分を1チップに統合したもの)において、ランタイムでAIの“推論”部分をアクセラレートすることに特化したNPUの搭載が進んでいるという点だ。

 言われてみれば、標準でカメラを搭載するスマートフォンでは、顔認識や画像の分類といったタスクにNPUが活用できるケースが多い。CPUで“推論”を処理するより、ずっと少ない電力消費で済むなら、バッテリーが生命線のスマートフォンにとって、この上なく好都合だ。

【ディープラーニングの飛躍】

【ディープラーニングのトレンド】

 その他、プロセッサと同様、チップ上にトランジスタを形成するメモリにおいて、現在主流のDRAMがプロセッサ以上に行き着くところまで行き着いており、回路の工夫で高密度化するのはあと1回、その後はまったく別の技術を用いたデータ保持方法で、フラッシュROMのように常に通電していなくても記憶し続ける不揮発メモリに移行するという話題も興味深い。

【メモリ技術トレンド】

 インテルが本年4月に正式発表した3D XPoint不揮発メモリの「Optane DC Persistent Memory」では、DDR4互換インターフェイスを備えるが、アクセス速度に関しては、まだまだDRAMに遠く及ばない。PCでDRAMと混載して使用する際、仮想メモリ領域として使用するモードが選べるが、ビジネスアプリケーションならともかく、“スワップが発生したら負け”のゲームプレイにおいては、あと100倍高速にならないとDRAMを置き換えるものにはならない。

【メモリ技術トレンド】

 コンソールゲーム機では、メインストレージにHDD、メインメモリのDRAMと混載させて、不揮発メモリをHDDキャッシュとして活用すれば、既存のハイブリッドHDD以上のファイルIOパフォーマンスが期待できるが、このケースで期待できるのは、せいぜいゲーム起動時のファイルローディングや、ゾーンニング時のフィールドアセットのローディングによる“待ち時間”の短縮と限定的だ。それでもゲーム体験を向上させることには違いないが、本命は次世代のMRAMやReRAMといった不揮発メモリだ。

【SIGGRAPH2019 Intelカンファレンスより】
“10倍の性能を持った新アーキテクチャが10年毎に登場するとしたラジャの法則”
“(電気自動車バッテリーを視野に)最適価格を最初に導き出してから実現のための方法論を探るとしたイーロンの法則”
“ムーアの法則を超える成長のための唯一の方法はソフトウェアにあり”とし、斜め上の事象を持ち出して、もはや良くわからないことを言い出し始めたインテル。それほど設計や材料、工法の見直しで“ムーアの法則”を維持する道は険しい

2019年9月版次世代コンソールゲーム機のスペック予測

 以上のように後藤氏の講演は、プロセッサを中心としたチップに関連する近年の技術トレンドがみっちりと詰め込まれており、総まとめとしては大変有意義なものだったが、コンソールゲーム機におけるゲームプレイの“楽しさ”や“ワクワク感”を決定づけるのは、必ずしもプロセッサやメモリの性能だけではない。

 最後にこの点を踏まえ本年4月6月に行った次世代ハード予想をアップデートして、本年中の最終予測としたい。

【AMD E3 2019カンファレンスより】

 まず、プロセッサに関しては、伝え聞く情報を素直に信じると、GPU、CPU、RTの各コアは7nmであると予想されるが、コスト次第ではCPUコアが14nmということも考えられるだろう。

 ゲームの実行には、伝統的にコア数よりクロック周波数が高いほど有利であるため、クロック志向は強いだろうが、RTコアという枯れていないチップレットを搭載することによるコスト高要因を、CPUを安く作れる14nmにとどめて吸収する可能性もあるのではないだろうか。CPUコアが14nmなのに7nmのAPUと主張しても、GPUコアやRTコアが7nmなら、全部を正確に表現していないからといって嘘をついているということにはならないだろう。動作クロックの方は、順当に引き上げられるとすると、2.5GHz前後が妥当なところだろうか。7nmのZen2なら3GHz前後ということもあり得る。

【AMD E3 2019カンファレンスより】

 GPU側は、RX 5700にRTコアを加えたものだとして、クロックの方は1.4GHあたりが実現されれば妥当なところだ。次世代PSは、PS4と同様、CPU側からもGPU側からもアクセスできる共有メモリをGDDR6で8GBまたは16GB用意してくるだろう。次世代Xboxは宣言によって切り分けて使う方式で同程度の容量というのが、現世代との互換性を考慮しても順当なところだろう。

 プロセッサに関しては、両ハードともそれほど大きな差はなく、パフォーマンスに違いが生まれるとすれば、CPU/GPU内蔵キャッシュの量や、共有メモリの取り扱い方、バス幅の違いによって生じるものにとどまるのではないかと予想する。クロックに大きな差がないなら、どちらかというとドライバの完成度や、使用するAPIいったソフトウェアの方が影響は大きいように思う。

【AMD E3 2019カンファレンスより】

 ストレージは、USB-C接続の外付けHDDか内蔵ベイにカートリッジ式で交換可能なHDD、本体側に32GBか64GBのSSDか不揮発メモリを採用して、これをソフトウェアでハイブリットHDD的なキャッシュとして使用する実装が考えられる。ワールドワイドでみたとき、4K8Kの映像コンテンツの主戦場はVoDであるため、やはり光学ドライブは標準で搭載されずUSB-C接続のオプションとなるのではないだろうか。

 HDMI2.1によるディスプレイ出力を、SDRの8K解像度で最大30FPS、4K解像度で最大120FPS、いずれもVRR(可変リフレッシュレート)対応だとすると、やはりHDR時の解像度は4Kに留まるのではないだろうか。

 対する入力ペリフェラルの方は、既存のコントローラーを踏襲したものになるだろう。新たにコントローラーに対して搭載される機能としては、ボイスコマンドやボイスチャットを意図したマイクが採用され、顔認識やフェイシャルキャプチャ、ビデオチャット用にステレオカメラが標準で搭載されると楽しいデバイスになる。コンソールゲーム機の場合、過去にもコントローラーの新機能をセールスポイントの目玉に位置付けることは多々あり、これらの機能あながちないとは言えないだろう。

 コントローラーからのハプティクスに、既存のバイブレーションだけでなく、エアのブロウや温度変化を採用すれば、視聴覚を超えた感覚フィードバックが拡充されることになり、これも楽しいが、バッテリーの関係で現実には難しいだろうか。

【AMD E3 2019カンファレンスより】

 通信規格としては、Wifiは最新のIEEE802.11ax(Wifi6)までに対応してルーターに接続したデバイス全体のスループットが向上すると共に、Bluetoothは5.1に対応して、コントローラーの位置が良好な精度で取得できるのなら、これまでのようなセンサーの設置が不要で、もっと手軽にコントローラーによるハンドジェスチャーが楽しめるかもしれない。据え置き型である以上、モバイル通信には対応しないと思われる。

 今年のSIGGRAPHやgamescomでは、AMDからのめぼしい発表がなく、SIEやMSもAMDと同様、E3以降は沈黙を保っている。SIGGRAPHでのプレス向け個別プレゼンテーションの内容もE3のおさらいであった。このため、次に新情報が期待できるタイミングは、早くてCES2020に先立つ本年末から新年早々、遅くてComputex Taipei2020に先立つ5月末からE3の会期中にかけてということになるだろう。

 2020年のクリスマスホリデーシーズンにリリースするためには、製造のリードタイムを考慮して、これらの時期には当然ハードウェアの最終スペックが固まっているはずであり、あとは発表のタイミングだけが問題となるはずだ。過去の例では、SIEはおおむね1年程度、MSは半年程度、発売に先立つタイミングで正式発表されていることからも、やはりCES開催前か、Computex/E3開催前の線が濃厚だ。久しぶりの新コンソールハードを、あれこれ予想しながら、楽しみに待ちたい。

【AMD E3 2019カンファレンスより】