ニュース
VRの音響はどうあるべきか?「VR ZONEにおけるVR立体サウンド演出」
バンダイナムコのサウンドチームが語る、VRのための音作りの秘密
2016年8月27日 09:03
4月からお台場で運営されている「VR ZONE Project i Can」では数々の良質なVRアクティビティを手軽に楽しむことができるが、VRならではの臨場感をもたらす上で大きな役割りを果たしているのがサウンド演出だ。ユーザーの聴覚を刺激し、映像と調和してVR空間への没入を高め、ときには映像が伝える情報をさらに強化する。そういった効果をもたらすVRサウンドはどのようにして作られたのだろうか。
そのあたりの事情が明かされたのが、「仮想世界はここにある!『VR ZONE Project iCan 』におけるVR立体サウンド演出」と題するセッションだ。登壇したのはバンダイナムコスタジオの技術本部サウンド部で「VR ZONE」コンテンツの開発に携わった3名のスタッフたち。サウンドディレクターの矢野義人氏と倉持啓伍氏、サウンドデザイナーの橋本大樹氏だ。
登壇した3名ともに「鉄拳」、「太鼓の達人」などバンダイナムコのヒットタイトルでサウンド制作を担当してきており、サウンドエンジニア及びサウンドクリエイターとしての経験が豊富。本セッションではその経験豊富なサウンドチームがVR ZONEのために手がけた「急滑降体験機 Ski Rodeo」、「ホラー実体験室 脱出病棟Ω」、「スーパースター体感ステージ Max Voltage」の3作品について、VRサウンド制作のコツとノウハウを語ってくれた。そこでは、たったひとつの音にも多くの思いや方法論が込められており、本格的なVRサウンドがどういうものなのか、貴重な知見を与えてくれる。
ロケーションベースのサービスならではの特殊点もある。まず前提として、どのコンテンツも再生環境があらかじめ決まっていること。5.1chスピーカーシステムを用いる「Max Voltage」を除く作品では、Audio-technicaのATH-PDG1、AKGのK240MK2といったセミオープン型と言われるヘッドフォンを使用している。セミオープン型としたのは、体験中でもある程度外部の音を聞き取れるようにすることで、非常時(火災や地震等)の安全を確保するためだ。
講演によれば、VR ZONEの各コンテンツのサウンド開発には、バンダイナムコ内製のサウンドエンジンであるNUSound3を採用しているという。このエンジンはバイノーラル音響シミュレーションによる3Dポジショナルオーディオ再生にも対応しており、独自の立体音響システムを構築。各コンテンツでこの特徴がフル活用されている。
滑走音の再現のためだけに大量のオーディオチャンネルを駆使した「Ski Rodeo」
橋本大樹氏がサウンドを担当した「Ski Rodeo」は、スキー板を模した専用の体感筐体を用い、非常に高いレベルで大滑降の臨場感と迫力を味わえるVRアクティビティだ。入力装置でもあるステップには足元に伝わる振動が再現され、ユーザーの眼前に配置された送風機からは“風”を感じられるという凝った作りで、映像・触覚の双方で没入感を高めている。感覚の同時刺激という点で特に重要な役割を果たすのがサウンド部分だ。
例えば、ユーザーの足元に路面の感触を伝える振動システムは、サウンドを使って制御されている。これにはゲーム中で滑走音を再現するシステムの一部として駆動しており、振動システムには滑走音を構成する音源のうち、非常に低周波の成分が送り込まれている。スピーカーを通して聞くと、「ブゥゥン」というコイル鳴きのような音だ。
もちろん、滑走音の大部分はヘッドフォンを通じてユーザーの耳に直接届く。そこでポイントとなるのが、路面状況やスキー板の接地状況等に応じて、いかに説得力のある滑走音を生成するか。そこで本作では、滑走音をいくつかの要素にわけ、そのすべてのパラメトリックに制御する仕組みを導入した。
その要素となるのは、まず前進スピードに応じて変化する基本の「サーッ」という滑走音。次に、板の傾斜とスピードに応じて変化する「ジャッ!」というエッジ音。そして、横方向のスライドに応じて変化する「ザザッ!」というスライド音、そして、高速滑走時に耳元にぶつかる風当たりの音だ。
これらの各要素は、ゲーム中の速度や傾きといったパラメーターに連動して音色が変化するようプログラムされている。その基盤となっているのがNUSound3エンジンの機能だ。サウンドデザイナーはこの機能を利用することで、パラメーターによるサウンドの変化具合を手軽に調整できるのだという。
これに雪質(新雪・圧雪・アイスバーン・岩場)といった路面の違いによる音源の変化や、岩場の近くを通過する際の風切音の変化等も加わり、凄まじい量の音源を同時に再生することで、滑走音全体を再現。オーディオチャンネルを可視化した映像では、軽く30チャンネル以上のトラックが滑走音の再現に使用されている様子が確認でき、その徹底ぶりに驚かされる。
またVRならではの特性として、PC画面でのプレイに比べて世界全体のスケールが大きく感じられるため、相対的に、サウンドが予想したよりも近く、軽い音に感じられやすい傾向があるという。このためVR環境で見た際のスケール感や距離感に対応するよう、サウンドの低音部分を補強するなど、VR向けの微調整にもかなりの工夫を要したとのことだ。サウンドデザインにおいても、VR環境で実際に確認することの大事さを物語っている。
「脱出病棟Ω」で目指した、防衛本能に訴えるサウンド演出
ホラー系のVR体験である「脱出病棟Ω」のサウンドを担当した倉持啓伍氏は、作品ディレクターから「とにかく怖がらせて!」という、えらく大雑把な指示を受けて本作のサウンド制作をスタートしたという。2~4名で同時プレイする本作では、恐怖を他者と共有することで楽しさに変わる、という製品コンセプトを掲げており、つまるところ作品を楽しいものにするためには、ベースとなる「恐怖」を限界まで高めることが必要だったというわけだ。
そこで倉持氏は、恐怖という感情について、「外敵などの危機から実を守るための防衛本能」という考え方をピックアップ。本作ではいかに、防衛本能に訴えるサウンド演出を作り出すかが制作のテーマとなったとのことだ。
サウンドによる恐怖演出の重要要素となるもののひとつは、プレイ中に常時耳にすることになる「環境音」。本作は雑音の多い施設内で提供するコンテンツであることもあり、ユーザーの聴覚をある程度外界から隔絶するためにも、常時持続的に環境音を鳴らすことで、外部の雑音をかき消す必要があったという事情もあるという。
環境音だけで恐怖を感じてもらうにはどうすればよいか。倉持氏がまず参考にしたのはWaterphoneという、不気味な不協和音を生み出す楽器である。Waterphoneはひっかくような金属音を鳴らし、平行して立つ多数の金属柱から低周波・高周波の反響音が鳴り響く。
もうひとつ参考にしたものは、「19Hzの音を聞くと幽霊が見える」という俗説だ。20Hz以下の音は人間の耳には聞こえないため効果があるかは実際には不明だが、本作の環境音では常に、この19Hzの低周波音が鳴り響いているとのことだ。前述のWaterphoneを参考にした不協和音と組み合わせてできた音は、文字にするなら「ズズズズ……」という感じで、ちょうどホラー漫画でお化け屋敷を目前にしたときの擬音の印象に非常に近い。実際、聞いているだけで不安になってくる音である。
恐怖を作り出すもうひとつの要素が「効果音」だ。ここで問題になるのは、VRでは従来のゲームのように操作するキャラクターが存在しないということ。キャラクターに怖がる演技をさせてユーザーを間接的に怖がらせるといった従来の手法は使えず、演出を持って直にユーザーの恐怖心を煽る必要がある。そこで最大の効果を得るにはどうすればよいか、というと、倉持氏の見解は「感情の振れ幅を最大にする」ということである。
つまり、既に緊張が高まっている状態で「バーン」と怖い演出をしても、既にユーザーは身構えているので、恐怖効果は低くなってしまう。逆に、ユーザーを一度安心・油断させておくと、恐怖へ向かう感情の振れ幅が大きくなり、演出効果が最大化される。そこで重要なのが、ユーザーを一度安心させるために、事前に小さな緊張を与えておくことだ。
例えばこうだ。不気味な空間を進むとき、どこからともなく水滴の音が聞こえてくる。ユーザーはその音に気が付き、身構える。水滴の音は次第に大きくなっていき、次第に緊張が高まっていくが、何も起こらない。ずっと緊張しているわけにもいかないので、ユーザーはいったん緊張を解く。「何もなかったな」と思って油断したしたその瞬間、ババーンとバケモノが! というわけだ。
こういった緊張を誘うサウンドエフェクトのため、本作ではポジショナルオーディオを駆使。特に「背後から聞こえてくる音」はユーザーの危機感や緊張感を誘う上で非常に効果的だったという。
また、多人数同時プレイの作品として興味深いとされたのが、ボイスチャットによる効果だ。本作の参加プレーヤーは全員がマイク付きのヘッドセットを装備し、プレイ中は常にボイスチャットが行なえるようになっているため、恐怖に遭遇した他のプレーヤーの悲鳴が聞こえてくるのである。各プレーヤーはそれぞれ別のルートを通り、恐怖の瞬間もまた別々になっているので、ヘッドセットに悲鳴が聞こえても一体何が起こっているのかわからない。これが未知の不安を煽ることで、さらにプレーヤーの緊張感をそそることができたのだという。
倉持氏が語るように、VRでは恐怖から逃れるために目を瞑ることはできるが、耳をふさぐことはできない。VRホラー作品にとって、サウンド演出は映像以上に重要な部分かもしれない。
5.1スピーカーで広大なコンサートホールの音響を実現した「Max Voltage」
矢野義人氏がサウンド制作を担当したVRアクティビティ「Max Voltage」は、2,000人の観客を前にステージへ立ち、歌やボイスパフォーマンスといったスーパースターのステージアクションを臨場感たっぷりに体験できるという異色のVRコンテンツだ。
本作で重要になるのが、ライブハウスやコンサートホール特有の、腹にまで響くような大音響の環境をいかに再現するかということ。他のコンテンツのようにヘッドフォンで再現するというわけにはいかず、そのため本作だけが5.1サラウンドシステム+専用防音室という構成のアクティビティとなっている。
ところが、スピーカーを使うことで大きな問題が発生する。VRコンテンツではHMDのポジショナルトラッキングによってユーザーが自由に動き回れるのだが、ユーザーの位置が変わると、スピーカーとの物理的距離がかわり、相対的な音量が変化して音の聞こえ方が変わってしまうのである。これによりユーザーは、すぐ近くに接地されたスピーカーの存在を認識し、空間を狭く感じてしまう。これをどう改善するかが工夫のしどころだった。
そこで矢野氏は、「スピーカーの存在を消す」ために、HMDのトラッキング情報を有効活用した。あらかじめ5.1chスピーカーの各位置をプログラムに登録しておき、リルタイムにプレーヤーとの距離を検出。プレーヤーの位置に応じて各スピーカーの音量を調整する(近づけば小さく、離れれば大きく)ことでユーザーの感じる各スピーカーの音量を一定化し、「スピーカーの存在を消す」ことに成功したというわけだ。
トラッキング情報はマイクとスピーカーのハウリング問題の解消にも役立っている。本作ではプレーヤーが持つマイクもポジショナルトラッキングに対応しており、マイクとスピーカーの距離、マイクとユーザー頭部の距離をそれぞれ検出できる。そこで、マイクがスピーカーに近接した際や、マイクがプレーヤーの口からある程度離れた場合に、マイク音量を絞る処理を実装。これによりハウリングを抑制することができた(ハウリング防止用のオーディオ処理ソフトウェアも同時に使っているとのこと)。
VRコンテンツならではの発見もある。矢野氏によると、本作ではスピーカーから爆音ともいえる音量で音を出していても、HMDをかぶると爆音と感じられなくなる不思議な効果があったという。これはどういうことかというと、HMDを装着した瞬間、視覚がコンサートホールに飛ばされる。その結果、ユーザーが経験的に持っているコンサートホールやライブハウスの爆音体験が記憶から引き出され、室内で爆音と感じられる程度の音量では平気になってしまうのだ。
といった発見もあり、様々な工夫をもってユニークなサウンドデザインが行なわれた「VR ZONE」のVRアクティビティの数々。VRコンテンツでは映像と同じか、それ以上にサウンドが重要だという認識を持つことができる。今後、いろいろなVRコンテンツを試す際には、そのサウンドの出来栄えにも注意してプレイしてみたいものだ。