研究概要 |
人間は雑踏やパーティーの中でもある人の声あるいは音に着目して,いとも簡単にその音を聞き分けコミュニケーションをとることができる。本研究では,人間が普段行っているように音響環境・空間情報・対人情報を含むコミュニケーションコンテンツ,コミュニケーション環境情報の理解と記述を行い,それらをオブジェクト符号化することにより高臨場感通信を目的とした三次元音場の理解と記述を行う。 具体的には,マイクロホンアレーの技術を基にした音場の空間情報の把握,伝達系の予測,聴覚機構を考慮することにより複雑な系においても音環境の理解を可能とする手法を提案する。今年度は特にマイクロホンアレーを用いた信号処理においてMatching Pursuitアルゴリズムを用いることによりこれまで不可能と言われてきた2つのマイクロホンを用いての多音源方向推定を以下のように行った。 (1)4月〜7月 マイクロホンアレーの技術を基にした音場の空間情報の把握について文献調査をもとに理論的考察を加え,Matching Pursuitアルゴリズムを用いた2マイクロホン収音での多数音源方向推定法を適用した手法について考察した。 (2)8月〜12月 今回購入したパーソナルコンピュータを用いて2マイクロホンを用いた音源方向推定システムを構築した。比較的残響の少ないスタジオ,実環境での評価を行った。その結果,実環でも従来の方法に比べ高い精度で多数の音源方向を推定することが可能であった。 (3)1月〜3月 パーソナルコンピュータでの結果に基づき主に音源方向推定を行う空間情報把握システムを構築した。本年度の研究成果を学会で発表した。 来年度以降、本年度提案した手法により得られる音場の空間情報とそれを利用した音源分離手法によりオブジェクトを記述する。また,記述されたオブジェクトを伝送・再現する三次元音場再現システムを構築し,聴感的評価を行なう。
|