|
会場:東京大学
このセッションでは、映像・音響処理におけるテクニックを紹介するとともに、同社のミドルウェア製品群「CRIWARE」でのデモを実施。昨年までの同社のセッションでは、同社のミドルウェアのデモを行なうという色が強かったが、今年は商売っ気を薄め、あくまでテクニックを主軸に置いた内容で発表を行なった。 2つのセッションにおいて合計33のテクニックが発表されたわけだが、これは時間内に講演を終えるために絞り込んだもので、本当はこの数倍のテクニックを紹介したかったという。それでも本稿で全てのテクニックを紹介するとあまりに膨大な量になるので、ここでは2つのセッションの中から、面白かったテクニック、またユーザーにも使えるテクニックをいくつか紹介していく。
講演者は、CRI・ミドルウェア 専務取締役の押見正雄氏。DS、Wiiのムービーに関する部分は、同社研究開発部の櫻井敦史氏が、PS3、Xbox 360のムービーに関する部分は、同社研究開発部ビデオグループリーダーの福田学氏が説明を担当した。
■ マイクを活用する秘技(DS) DSに内蔵されているマイクの音声入力から、ピッチ(音程)を検出する方法の1つとして、AMDFでピッチ(音程)を調べる方法が紹介された。 AMDFとは、信号の波形をずらしていき、その差分の絶対値の総和を計算する方法。図で示されたものでいうと、波形がずれてできた隙間の面積がAMDF値ということになる。ずらす前のAMDF値は当然0で、その後ずらしていくとAMDF値が増減し、ある1点でAMDF値が0に近づく。ここが波形をずらしていって再び重なるように見えた部分、つまり1周期となり、その幅でピッチを判別できる。
この方法では、計算に加算と減算のみを使うため、自己相関やFFTよりもCPU負荷が小さいという利点がある。同社が実際に作成したソフトでは、DS上で4ms程度で処理できるとしており、実際にリアルタイムに音程を検出するデモも行なわれた。DSのマイクから12kHzでサンプリングし、フレーム長を50Hzで振幅を検出した場合、25%程度のCPU負荷でリアルタイムに処理できるという。
■ 高速にデータを読み込む秘技(Wiiほか) DVD-ROMなどのディスクメディアから、効率よくストリーミングデータを読み込むことで、その他のデータ読み込みの時間を伸ばす手法。これは同社のミドルウェア「CRI Audio」の中に組み込まれている、「D-BAS(ダイナミックバッファアロケーションシステム)」として実装されているもの。 通常、ストリーミングデータを扱う場合、再生するストリームの数だけバッファを用意する。このバッファを静的に確保すると、例えばデータロード中に音楽しか流れていない場合、セリフや環境音のバッファが空のまま確保された状態になる。 これを効率よく使用するのが「D-BAS」の手法。音楽とセリフを同時に再生している時は、当然それぞれにバッファを用意するが、セリフが終了するとそのバッファを音楽のバッファに結合する。音楽のバッファを大きく取れれば、その分ストリーミングデータを取りに行くためのシークが減り、総合的なデータ読み込み時間の短縮につながる。 逆にセリフや環境音などのストリーミングデータが増えた場合、今度は音楽のバッファを分割し、セリフや環境音のバッファとして譲渡する。そしてまた各ストリーミングデータの再生が終わると、それぞれに戻す。動的にバッファサイズを変化させることで、無駄なく効率のいいストリーム再生を実現している。
ちなみに「D-BAS」の副産物として、ディスクのシーク回数が減少することで、シーク音の減少やドライブの寿命を延ばすといった効果も得られるという。
■ リモコンの音を綺麗にする秘技(Wii) Wiiリモコンに内蔵ているスピーカーから出す音を綺麗にするためのテクニック。このスピーカーは小型で、いい音を出せるものでもないので、その中で少しでも聞き取りやすい音を出すための音作りのコツが語られた。 ポイントとして3点挙げられている。高い周波数のままコンプレッサをかけるとノイズが増加するため、リモコンの最大サンプリング周波数に合わせてリサンプルする、リサンプリングによって欠落する高周波成分を補強する、音声の場合は2.5~3kHz摩擦音の成分を強調すると聞きやすくなる、と説明された。
中でも最後の音声を扱う場合について、デモを織り交ぜながら詳しく説明された。まずオリジナルの音声をそのまま送ると、「し」や「ち」といった発音でノイズが出る。これをコンプレッサにかけるとノイズ(アンチエリアシングノイズ)が増えるので、6kHzにリサンプリングしてノイズ低減を図る。さらにこの状態から子音を聞き取りやすくするため、2~3kHzを4db程度ブーストする。これで音質的にもかなり改善される。より高音質が欲しいならば、さらに32kHzにアップサンプリングを行なう。
■ ムービーのファイルサイズを節約する秘技 PS3とXbox 360向けのセッションでは、「ノイズの少ないムービーを作る秘技」として発表されたもの。ムービーをエンコードする際、ファイルサイズを節約しながらノイズをなるべく減らすためのテクニックが発表された。 ムービーの精細さやノイズの量は、エンコードの段階で決まる。高いビットレートならばノイズがなく、ビットレートを落とすほどノイズが増えることになる。ファイルサイズの制約と妥協できる画質の重なる点をうまく見つけるのがまず第1のポイントである。 ただ、絶対的にファイルサイズが決まっており、ビットレートが低すぎて求める画質が出せない場合もある。その際には、解像度を落とすのも1つの方法となる。例えば、640×480ドットのムービーを3Mbpsで圧縮するよりも、横幅を狭めて480×480ドットにし、同じ3Mbpsで圧縮したほうが、いい結果が得られることもある。元の映像の解像度が低ければ、圧縮の際にも当然有利で、ノイズも出にくくなる。
動画は静止画ほどに解像度が気にならないため、解像度を下げることで良好な結果を得られることは多いという。なお再生時には、横幅を引き伸ばし、640×480ドットで表示することになるので、切りのいい倍率の解像度にしておくといいとしている。
■ ステレオ音源をしゃぶりつくす秘技 こちらはクリエイターだけではなく、ユーザーレベルでも生かせるテクニック。ステレオ音源を3Dサラウンドに変換するというもので、「マトリックスサラウンド」と呼ばれている方法が示された。 「マトリックスサラウンド」では、フロントの左右とリアの左右で、計4個のスピーカーを用意する。ステレオ音源は左右の2つの音声データしか持っていないが、左リアには、(左-右)を、右リアには(右-左)の音声を入力する。これによって、3Dサラウンドを実現する。音の定位という意味で考えると嘘になるが、全体に包み込まれるような音を実現できる。
またこれを応用して、(左+右)でモノラル成分、(左-右)でサイド成分を抽出し、センターのボーカルの音量だけを制御することも可能。会場では実際にデモを行なうとともに、接続図も示されたので、興味のある人は試してみていただきたい。
□CESAのホームページ http://www.cesa.or.jp/ □「CEDEC 2007」のページ http://cedec.cesa.or.jp/ □CRI・ミドルウェアのホームページ http://www.cri-mw.co.jp/ (2007年9月27日) [Reported by 石田賀津男]
また、弊誌に掲載された写真、文章の転載、使用に関しましては一切お断わりいたします ウォッチ編集部内GAME Watch担当game-watch@impress.co.jp Copyright (c) 2007 Impress Watch Corporation, an Impress Group company. All rights reserved. |
|