SIGGRAPH ASIA 2009レポート

NVIDIA、あらゆる業界にGPGPUパワーを提供する多方面戦略
ゲームをはじめ、WEB、映画、放送、医療、建築など。NVIDIAの最新技術動向を紹介


12月16日~19日開催

会場:パシフィコ横浜



 12月16日よりパシフィコ横浜で開催されているSIGGRAPH ASIA 2009。2日目となる17日には、本カンファレンスのゴールドスポンサーを務めるNVIDIAによるセッションが数多く設けられた。

 NVIDIAは一般に「ゲーム用グラフィックスチップベンダー」という風に解されることも多いが、現在では映画や放送といった映像制作関連の業種ともつながりが深く、ゲーム以外のエンターテインメント分野に多くの貢献をしている。またそれだけでなく、近年では映像制作以外の幅広い分野にも、そのテクノロジーを積極的に提供し始めている。

 今回NVIDIAが行なった講演や展示では、そういったNVIDIAの企業戦略をつぶさに見ることができた。特にエキサイティングなのは、これまで思われていた以上にハイペースで進められる、GPUパワーの積極的活用だ。新たなテクノロジーがゲームをより美しく、面白くするだけでなく、より広い意味でのエンターテイメント、そして実用分野でも新たな地平を切り開きつつある。

 本稿ではNVIDIAの講演・展示内容をピックアップし、高性能グラフィックスチップを中心として展開する最新の技術動向をお伝えする。

【NVIDIA関連セッション・展示】
SIGGRAPH ASIA 2009のゴールドスポンサーであるNVIDIAは、基調講演を含む多数の講演を行なったほか、展示ホールでは最新のグラフィックス、GPGPU関連テクノロジーをふんだんに紹介。多方面の業種に向けたソリューションを公開していた



■ 基調講演「ヘテロジニアス・コンピューティングの効果」
 特別研究員デイビッド・カーク氏がGPUパワーの新たな活用法を訴える

演壇に立つNVIDIA特別研究員ディビッド・カーク氏
NVIDIAのGPUの歴史。並列プロセッサとして急激に性能を向上させてきた
レイトレーシングは並列プロセッサに最適なスケーラビリティを持つ
リアルタイム・レイトレーシングによる出力結果。速度を出すため、ライティングはシンプル1次反射までのようだ
パスレンダリングにおけるCPUとGPUの比較。GPU処理のほうが比べ物にならないほど高速だ

 NVIDIAの特別研究員を務めるデイビッド・カーク氏が登壇した基調講演では、「ヘテロジニアス・コンピューティングの効果」と題し、CPUとGPUの協調により実現する新たなコンピューティングパワーの価値が訴えられた。

 カーク氏はまず、これまでの歴史をまとめた。1990年代末に初の「GPU」として登場したGeForce 256以降、現在までに急激に向上したグラフィックスパフォーマンス。それにより美しいグラフィックスでゲームが楽しめるようになったのは万人が納得するところだ。さらには2006年以降注目されるようになったGPGPU技術に代表されるように、近年のGPUはグラフィックスチップというよりも並列プロセッサとしての側面に光が当てられるようになっている。

 カーク氏はCPUとGPUの処理特性の違いに言及し、「CPUとGPUに、それぞれ適したタスクを割り当て、協調動作させることがことの本質である」と語る。これが氏のいう「ヘテロジニアス(異種間の協調)・コンピューティング」だ。カーク氏は、2015年時の予測として、CPU単体では現在の3倍にしかならないものの、CPUとGPUの組み合わせならば、現在の570倍のコンピューティングパワーが得られると話す。

 カーク氏はその応用範囲として、レイトレーシング、グラフィックスサーバー、ボクセルレンダリング、パスレンダリング、物理シミュレーション、流体シミュレーションといった実例を挙げていった。

 ゲーム業界からも熱い注目を浴びつつあるレイトレーシングだが、NVIDIAではすでに「OPTiX」というレイトレーシングエンジンを提供開始している。このエンジンでは数十万~数百万ポリゴンで構成されたシーンを、ごく簡素な画質ならば現時点のGPUでリアルタイム動作させることが可能だ。

 よりリアルなレンダリングのためにはさらに多くの光学シミュレーションを行なう必要があるのだが、レイトレーシングの強みは抜群のスケーラビリティにある。例えば「OPTiX」では、最高画質のレンダリングを、アニメーションを止めることなく「じわじわと」進めるという、プログレッシブレンダリングにも対応している。この技術はデザイン分野で大いに活用されそうだ。

 また、GPUによってパスレンダリングを行なうアイディアも興味深い。パスレンダリングとはフォントなどのベクトル画像を描画することで、Adobe FlashといったWEBアプリケーションで多用されている。これまではすべてCPUで処理するのが通例だったが、GPU処理に置き換えることにより、CPUに比べて少なくとも10倍、極端なケースでは300倍近い速度でレンダリングすることができる。

 より高速にレンダリングできるということは、必要なフレームレートで描画を行なうために必要な電力コストが低いということも意味する。このことは、低速なCPUを搭載するモバイルデバイスに安価なGPUを搭載すれば、よりリッチな表現とバッテリーの長寿命化が両立するということを意味するだろう。実際、NVIDIAはこのメリットを生かす取り組みを本格的に始めている。

 そういった実例を紹介した上で、カーク氏は「ヘテロジニアスな並列処理は、グラフィックス処理の手法を根本的に変えていく」と話し、講演を終えた。


OPTiXエンジンによるプログレッシブレイトレーシング。視点移動といったアニメーションが発生するとシーンのレンダリングがやりなおされるのだが、その処理は漸進的に行なわれ、ユーザーの操作を邪魔しない。しばらくカメラを固定していると、次第にグラフィックスが最高品質に磨かれていく。デザイン分野でプレビューに使いたくなる機能だ
話題は物理処理にも及んだ。NVIDIAのGPGPUプラットフォームであるCUDAベースの物理エンジンPhysXは、流体シミュレーションにも対応しており、ラリーカーが巻き上げる砂塵のような物質をリアルに表現できる。レンダリングには数万~数十万のパーティクルが使われるが、シミュレーションから描画までGPU側の処理で完結するため非常に高速だ
今すぐにできるゲームグラフィックスへの応用としては、既存のラスタライズエンジンにOPTiXレイトレーシングエンジンを組み合わせた「イメージスペース・フォトンマッピング」手法が紹介された。既存のポリゴナルモデルに“ちょっとだけ”レイトレーシングを行ない、それをもとにライトマップを作製、モデルのライティングに反映させるというアイディアのようだ。完全に正確ではないが、安価に説得力のある映像が得られる



■ Adobe FlashもGPUでアクセラレーション!
 ネットブックや携帯電話でもリッチなゲーム体験が可能に?

Adobe Flash 10.1のGPGPU対応により、WEBエンタメの定番である動画再生のすべてのプロセスが高速化される
携帯デバイス向けにデザインされたTegraファミリー
Flashのベクターグラフィックスがわずかな電力消費でスムーズに動作する

 ディビッド・カーク氏の講演で語られたパスレンダリングのGPU化は、すでに実用化が図られている。NVIDIAによるプレス向けの説明会で紹介された内容をもとに、モバイルエンターテイメント分野のGPU応用についてお伝えしよう。

 NVIDIAでは現在、HD動画の再生も可能な携帯デバイス向けチップ「Tegra」ファミリーの本格普及に向けて積極的な動きを起こしている。TegraはCPU+GPU構成をとる統合型プロセッサで、デスクトップ向けGPUと同じくCUDAコードを実行可能だ。その応用として今後のポイントとなってくるのが、Adobe FlashアプリケーションのGPGPUアクセラレーションである。

 WEBエンターテイメントや実用分野で広く使われているAdobe Flashは、ベクターグラフィックスの描画処理、すなわちパスレンダリングを徹底的に使うエンジンだ。このため描画の際の計算量が多く、現在のモバイルPC、携帯電話などではリッチなFlashアプリケーションがほとんど動作しない。それを来春搭乗予定のFlash 10.1では、GPUの力を用いて劇的に高速化する。

 実例として、ベクターグラフィックスを多用するFlashアプリケーションを、デスクトップ用CPUであるIntel Core 2 Duo 1.8GHzと、モバイルCPU+GPUであるNVIDIA Tegra 600 ARM 11で動作させた際のパフォーマンス比較が紹介された。

 結果はTegraの圧勝だ。Core 2 Duoは100%のCPU使用率で15ワット以上を消費しながら37.2fpsの速度で描画、一方のTegraはたったの0.15ワットで39.21fpsで描画する。パワー効率におよそ100倍の開きがあるというわけである。非力なネットブックや携帯デバイスでも、リッチなFlashアプリケーションがスムーズに動作することが期待できる。

 ちなみにFlash 10.1は、AMDのRadeonシリーズに搭載されている「ATI Stream」GPGPU技術にも同時に対応している。したがって、開発言語としてはオープン系の「OpenCL」が使われているが、その中でNVIDIA側の強みは何かというと、モバイルデバイスのためのワンチップソリューションであるTegraファミリーがそれに対応しているということに尽きるだろう。つまり、億台ベースの需要が存在する携帯電話市場を戦場にできるということだ。

 そのTegraを搭載する機器の代表例は、米国でマイクロソフトが販売する「Zune HD」だ。HD動画を出力することも可能な携帯デバイスとして人気を集めているが、Flashエンジンのアップデートが行なわれれば、リッチなFlashアプリケーションの動作も可能となり、さらに価値が高まるわけだ。また、同様のベネフィットは、NVIDIAのネットブック向けプラットフォームであるNVIDIA IONでも享受されることになる。

 NVIDIAではこの「Tegra」プラットフォームについて、日本市場を「クリティカルな市場である」と考えている。現時点では国内の携帯電話メーカーを含む大手数社と話を進めているそうで、近い将来に具体的な製品が発表できそうであるとのことだ。


Zune HDはTegraを採用し、HD動画の再生を可能にした。今後はFlashの高速化をはじめ、様々な応用が考えられる。日本でもTegraを搭載したデバイスが登場してきそうだ



■ 多方面の産業に展開するNVIDIAのGPGPUテクノロジー戦略

Quadroプラットフォーム。ミッションクリティカルな業務にも利用される
車両設計にPhysXによる流体シミュレーションを利用
NASCARの中継映像で車両周りの大気運動を可視化。強化現実的な活用といえそう

 今回NVIDIAが行なったプレス向けの説明会では、ゲーミングやモバイルエンターテイメントといった分野のほかにも、様々な分野での取り組みが紹介された。

 進歩著しいのが映像制作を中心とするプロユースの分野。そのプラットフォームとなっているのが、グラフィックスカードGeForceシリーズの業務用に当たるQuadroシリーズだ。そのQuadroでもGPGPUが活用できるようになったことで、CGレンダリングだけでなく様々な分野での業務を支援できるようになったという。

 まず面白いのがPhysXエンジンによる物理シミュレーション。ゲーム用と思われがちだがその実、PhysXの流体シミュレーションは業務利用にも耐えうる精度を持つとのことで、高級車のコンセプトモデルを設計する際に使用されたという実例が紹介された。従来のソリューションとは異なり、シミュレーションによる検証作業をモデリングツールに統合することができるため、設計改善のプロセスが劇的に向上したという。

 放送分野では、「Quadro Digital Video Pipeline」というソリューションを提供している。これは、複数のハイビジョン放送規格信号(HD-SDI)ストリームをQuadroカードを経由して入出力する仕組みだ。放送用品質の映像がビデオチップの処理対象となるのがポイントで、GPGPU技術を使って様々な映像処理をリアルタイムで行なうことができる。

 例えばCGで作られたセットとの完全な統合。顔面認識をはじめとする映像検出技術を組み合わせた、強化現実的な演出。実例として、NASCARの放送映像に車両周辺に発生する空気の流れを可視化したシーンが紹介された。これにより視聴者に「スリップストリーム現象」の効果を説明するのが格段に容易になる。サッカーや野球といったフィジカルスポーツの放送にも応用できそうだ。

 そのほかの興味深い例としては、物理的に正確なレンダリングを行なえるエンジン「iray」をQuadroベースのレンダリングサーバーで稼動させ、その映像をインターネット経由でWEBクライアントに出力する「RealityServer」ソリューションが紹介されている。このシステムは建築業界をはじめ、様々なEコマース分野での活用が見込まれるという。

 さらには医療現場でQuadroベースのグラフィックスワークステーションを使い、立体スキャンされた患者のボクセルデータをリアルタイム表示する技術も紹介されている。NVIDIA 3D Visionによる立体視表示を組み合わせることにより、異常個所の発見といった医療行為がきわめて効率化されるとのことだ。ゲーム用に開発された技術が、ミッションクリティカルな現場にどしどし応用されているというのは、非常に新鮮な驚きである。

 NVIDIAではこういった多方面の取り組みを通じ、自社の基盤技術であるGPUの可用性をこれまでにない次元に引き上げようとしているようだ。多くの分野でGPGPU応用の研究・開発が行なわれるようになれば、少なからずゲーム分野へのフィードバックも起こってくるはずだ。基調講演でカーク氏が述べた「ヘテロジニアス・コンピューティング」は、ますます目が離せないものになっていく。


エンターテイメントから様々な業界分野にQuadroプラットフォームの影響力が広がる
「iray」エンジンによる正確なレンダリングをサーバーで行ない、WEBクライアントに映像をリアルタイム送信するソリューション「RealityServer」。描画はプログレッシブに行なわれるため、カメラ操作が阻害されることがない。現時点では、建築設計を顧客にプレビューするサービスなどで関心が寄せられているようだ
医療分野への応用として、詳細なボクセルデータをリアルタイムに可視化するということもできる。これまでは高額な機器が必要だったそうだが、Quadroプラットフォームでは非常に安価に、しかも高速に実現できる。ちなみにここでデモされている人体モデルは、単体でデータ量が10GB以上もあり、従来のソリューションではレンダリングすることすら不可能だったそうだ

(2009年 12月 18日)

[Reported by 佐藤カフジ ]