|
会場:サンフランシスコ Moscone Convention Center
NVIDIAがDirectX 10.1への対応を行なわないことを表明した現時点としてはAMD (ATI) に続く二番手のDirectX 10.1対応GPUの登場ということになり、注目度は高い。 GDC会期中のノースホール展示会場のS3ブースでは、このChrome 400シリーズの実動デモを実践。単なるリリースベースの発表ではなく、製品が実在していることをアピールしていた。
発表リリース資料では、ほとんど公開されなかった詳細仕様をS3 GRAPHICS Product Marketing ManagerのBenson Tao氏に直接伺う機会を得たので、本稿はその取材内容をまとめてお届けする。
■ 汎用シェーダ32基。仮想敵はGeForce 8400~8600
製造は富士通65nmプロセスルールで、Tao氏によれば総トランジスタ数は約2億になるという。これはNVIDIAのGeForceでいうところのGeForce 6800 Ultra程度の規模に相当する。 S3としては初の統合型シェーダーアーキテクチャ (Unified Shader Architecture) を採用し、第3のプログラマブルシェーダである「ジオメトリシェーダ」の機能も備える。総シェーダプロセッサ数は32基で、負荷に応じて頂点シェーダ、ジオメトリシェーダ、ピクセルシェーダを動的に起用する仕組みを実装している。
接続バスはPCI-Express 2.0 x16に対応。コンフィギュレーションの変更でx1、x4、x8にも対応する。
ラインナップはChrome430GS/430GT/440GTXの3タイプとなり、それぞれの動作クロックは以下の通り。
プログラマブルビデオプロセッサ (S3ではProgrammable Video Engine: PVEと命名している) を搭載し、H.264、VC-1、WMV HD、DivXといったハイビジョン時代の映像コーデックのアクセラレーションに対応する。Chrome 440では同時に2つのビデオストリームのデコードに対応し、一方下位モデルのChrome 430は1本のビデオストリームにのみ対応し、ここで上下の差別化が図られる。
なお、市場製品価格はChrome 430が70ドル以下、Chrome 440が80ドル以下を想定しており、非常に安価なDirectX 10.1世代/SM4.1対応GPUとして提供される。
日本での発売は3月中旬を予定。Chrome 430はファンレス設計となり静穏PCマーケットにも訴求される。Chrome 440は電動ファン付きヒートシンク搭載の従来タイプのデザインを採用する。
■ Chrome 400シリーズのDirectX 10.1/SM4.1対応フィーチャーをチェック! Chrome 400シリーズのDirectX 10.1/SM4.1対応は本当なのだろうか。 「まだドライバが100%の完成度ではないが」とTao氏はエクスキューズを先に述べるが、Windows Vista Service Pack1のリリースとともにChrome 400シリーズはDirectX 10.1/SM4.1の全フィーチャーに対応するという。 ・4x MSAA最低保障 Chrome 400シリーズは浮動小数点バッファを含む32ビット幅、64ビット幅の全種類のバッファに対し最低4x MSAA (マルチサンプル・アンチエイリアシング) をサポートしなければならないDirectX 10.1/SM4.1の要項を満足する。 ・全8種のDirectX 10.1標準アンチエイリアスパターンに対応 DirectX 10.1ではアンチエイリアス (AA) のサンプルパターンの標準化が行なわれており、必須要件として1xと4xのサンプルパターンが規定される。さらにMicrosoftは2x、4x、8x、16xにおける追加の標準サンプルパターンを6種類規定しており、Chrome 400シリーズは前述の必須2パターンと合わせて合計8種類のサンプルパターンのすべてに対応するという。 ・指定周期でのアンチエイリアスに対応
定期的に異なるサンプル位置からサブピクセルをサンプルして行なうアンチエイリアスに対応する。たとえば4x AAにおいて4点のサンプル位置を1回のサンプルごとに切り換えて4サンプルで全サンプルが完了するようなアンチエイリアスを実装できる。もっと言えば、ATIが昔、実装していたTemporal AA相当の機能が標準規格としてDirectX 10.1に組み込まれており、Chrome 400シリーズはこれに対応する。
・ピクセルシェーダからのZバッファに対するMSAA、読み書きに対応する DirectX 10.0以前のピクセルシェーダでは、サブピクセルのサンプル時に、ここのサブピクセルに対応するZバッファ値の更新ができなかった。DirectX 10.1ではこの制約が取り払われたが、Chrome 400シリーズはこの機能を正しく実装している。 ・ピクセル・カバレッジ・マスキングに対応 DirectX 10.1はピクセルシェーダにおいて任意のサンプルを出力値に選択できる。これはフルプログラマブルなTransparency AAを実現可能にする。Chrome 400シリーズはこれにも対応する。 ・SampleInfoとSamplePos命令に対応 DirectX 10.1では、サブピクセルのサンプル数がSampleInfo命令から、サンプル位置をSamplePos命令から得られるように拡張された。Chrome 400シリーズはこの命令を仕様通りに実装。 最初のレンダリングパスで先にZバッファレンダリングや後の陰影処理に必要な項目の関連計算を適当なバッファに出力してしまい、これらの情報をもとにピクセル単位のZカリングを行ないつつ、ピクセルシェーダを動かしていくDeferredレンダリングなどにおいて高品位かつ高効率にAA処理が行なえるとしている。 ・レンダーターゲットごとの個別のブレンディング処理に対応 DirectX 10.0では複数のバッファに同時出力するMRT (マルチ・レンダー・ターゲット) における各バッファのブレンディング処理において、たった1つのブレンディング計算しか選択できなかった。DirectX 10.1では各バッファの組み合わせごとに任意のブレンディング計算を指定できるように拡張された。Chrome 400シリーズはこの機能に対応する。 ・キューブマップアレイに対応 DirectX 10.1ではキューブマップを配列構造で持つことが可能になる (キューブマップアレイ機能) ように拡張され、Chrome 400シリーズでもこの機能をサポートする。これにより、1つのピクセルシェーダから複数のキューブマップをレンダリングステートを切り換えずにアクセスができるようになる。 具体的な活用例としては、たとえば複数の動的光源からの全方位デプスシャドウを一度に処理できるようになったり、あるいは距離の遠近でスケールの違うキューブマップを持ったり、任意の位置の局所的な光の入出力を記述したキューブマップを持つことでレイトレーシングや大局照明の疑似実装ができるという。 ・頂点シェーダの入出力サイズの拡張 DirectX 10.0では128ビットのベクトル値が16個まで入出力できたが、DirectX 10.1のChrome 400シリーズでは倍の32個まで入出力が可能になった。 ・LOD命令の実装 DirectX 10.1対応のChrome 400シリーズでは、テクスチャサイズ、視点からの距離、重要度といったパラメータをもとにLevel of Detail (LOD) 値を返す命令が新設されている。LODは描画品質とパフォーマンスをバランスする仕組みで、本来はグラフィックスエンジンの機能の一環としてソフトウェア実装される仕組みだが、DirectX 10.1ではこれを補助する仕組みが命令レベルで実装された。戻ってきたLOD値をキーにしてテクスチャフィルタリングの異方性を切り換えたり読み出すテクスチャを切り換えたりできる。 ・より厳格な浮動小数点処理規定への対応 DirectX 10.1では4要素32ビット浮動小数点からなる128ビットテクスチャのフィルタリングへの対応が必須とされ、また4要素16ビット整数からなる64ビットテクスチャのブレンディングへの対応も必須となった。
また、DirectX 10.0までは浮動小数点計算の精度や丸め誤差などに関して厳格な規定はなかったのだが、DirectX 10.1ではIEEE規格に準拠した正確性が規格化された。具体的には丸め誤差については加算、減算、除算、積算、ブレンディング計算において0.5ULP (Unit in the Last Place) と規定されている。Chrome 400はこれらすべての要件への対応を果たす。
■ Chrome 400シリーズはノートPC向けDirectX 10.1対応GPUとしても訴求される
ユニークなのはMultiChrome動作時の「PanoChrome」テクノロジーだ。 2GPUで理論値2倍速なのはSLIやCrossFireと同じだが、MultiChromeではレンダリングしたフレームを2枚のChrome 400シリーズの4つのディスプレイ出力のうち、3つのディスプレイコネクタから3画面映像として出力できるのだ。
ブースではこれを実際にF1レーシングゲームを2GPU×3画面出力でデモンストレーションを実施、来場者の注目を集めていた。
Tao氏によればChrome 400シリーズのメインターゲットはコストパフォーマンス重視のメインストリーム以下のユーザー層だそうで、最安値のDirectX 10.1フル対応GPUとして訴求していきたいとのことであった。
1ワットあたりのパフォーマンスの高さに特化した設計をおこなっており、またメインメモリとGPUビデオメモリの双方を兼用して最大512MBのビデオメモリ活用を実現する「AccelRAM」テクノロジーにも対応しているため (ATI Hypermemory、NVIDIA TurboCacheに相当)、薄型のパフォーマンスノートPCクラスのGPUとしてもプッシュしていく戦略を考えているという。
DirectX 10.1世代/SM4.1対応GPUはATIの独断専行と見られたが、S3が突然の援護射撃を行なったことが、今後のPC 3Dグラフィックス動向にどう影響を与えるかが注目される。パフォーマンス的にはメインストリーム以下のレンジになるとはいえ、このレンジに競合が今のところ不在であるため、ちゃんと製品が潤沢に提供できればそれなりにユーザーに受け入れられる可能性はある。 Tao氏によればアジア、特に中国市場にターゲットを絞って力を入れて販売していくそうで、DirectX 10.1対応ハードウェアの普及率加速すれば、DirectX 10.0にとどまることを決定したNVIDIAの戦略にも影響を及ぼすかもしれない。
GPU第三勢力S3の今後の活躍には大いに期待したいところだ。
(2008年2月24日) [Reported by トライゼット西川善司]
また、弊誌に掲載された写真、文章の転載、使用に関しましては一切お断わりいたします ウォッチ編集部内GAME Watch担当game-watch@impress.co.jp Copyright (c)2008 Impress Watch Corporation, an Impress Group company. All rights reserved. |
|