2012 Fiscal Year Research-status Report
並列畳み込み処理に基づく複数聴取者のための仮想音空間共有システムの開発
Project/Area Number |
24700120
|
Research Category |
Grant-in-Aid for Young Scientists (B)
|
Research Institution | Akita Prefectural University |
Principal Investigator |
渡辺 貫治 秋田県立大学, システム科学技術学部, 助教 (20452998)
|
Project Period (FY) |
2012-04-01 – 2015-03-31
|
Keywords | 聴覚ディスプレイ / 頭部伝達関数 / GPU / 複数聴取者 / 複数音源 / マルチユーザー / マルチチャネル |
Research Abstract |
本研究では,複数の聴取者が同じ仮想的な音空間を共有するシステムの実現を目的とする.システムの原理は,音源から聴取者の鼓膜までの音の伝搬特性である頭部伝達関数を音源信号に畳み込むことで実音源が存在するときと同じ音信号を模擬することである.複数の聴取者が存在するとき,各聴取者異なる位置で音を聴取していることになるので,複数の頭部伝達関数を同時に処理する必要がある.研究代表者は,科研費 (21700140)によって,単独の聴取者に対し,複数の頭部伝達関数を畳み込むことで複数の仮想音源を提示する聴覚ディスプレイシステムを開発した.それを応用すると,複数の聴取者に対する処理も実現可能である.ただし,システムが全聴取者の位置を取得するために,新たなインタフェースが必要である.また,頭部伝達関数は個人性が強いため,聴取者数に比例してシステムが保持する頭部伝津関数の数が多くなる.もし,頭部伝達関数を小さなデータサイズで表現できれば,容量の削減などに効果的であるため,頭部伝達関数の簡略化の検討も重要である. 24年度では,簡略化の検討,及びインタフェースの検討に着手した.簡略化については,頭部伝達関数の音源位置の知覚に影響しない程度に量子化精度を低下させることで,データサイズを小さくすることが可能かを,聴取実験によって検証した.その結果,元の量子化精度が16 bitの頭部伝津関数を8 bitまで低下させても知覚に影響しないことが示唆された.ただし,音質については保証していないため,さらなる検討も必要である.一方,インタフェースの検討としては,Kinect (Microsoft)を使用して,カメラによる複数聴取者の位置の同時取得が可能かを検討した.基礎検討として,2人同時に位置を取得するインタフェースを実装し,得られた位置情報を検証した結果,実用上十分な精度で位置が取得できていることを確認した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初は,24年度では頭部伝達関数の簡略化のみを行う予定であった.しかしながら,システムの実現に必要なインタフェースの検討も行うことができたため,順調に開始できたと考えている.一方,それぞれの検討が全て目標まで達成できたわけではない. 簡略化については,まず,聴取実験の条件,被験者数が不十分であることが挙げられる.条件として,頭部伝達関数の方は量子化精度を低下させたものの,畳み込まれる音源信号の方は高い量子化精度であったため,システムに実装する際,実装の仕方によっては音質が低下する可能性がある.また,量子化精度を一様に低下させる方法を適用したが,音信号のレベルによって量子化幅を変えることで,音質の低下を抑えた簡略化の可能性もあるため,さらに検討することで,より効果的な方法が提案できるかもしれない. インタフェースの検討については,まず,現在のハードウェアの制約から2名までしか実現できていない.また,頭部伝達関数は本人のものではないため,聴取実験を行った結果,定位誤差が大きかった.そのため,客観評価としては所望の結果が得られたと言えるが,主観評価がまだ不十分である. どちらの検討においても,まず方法を発展させつつ,被験者数を増やして評価することが重要であると考えている.
|
Strategy for Future Research Activity |
頭部伝達関数の簡略化については,聴覚の特性を考慮し,より効果的な簡略化が可能かを検討する.例えば,レベルの小さい音は知覚されないため,その範囲では量子化幅は大きくすることができる.その分,レベルの大きい音は量子化幅を小さくすることで,オリジナルの伝達関数の特性をある程度保ったまま,全体のデータサイズを下げることができると思われる.つまり,音質の低下を抑えることが期待できる. インタフェースの検討については,大きく二つの方針を考えている.一つは,昨年度実装したシステムを拡張して聴取者数を増加させることである.例えば,現在使用しているセンサの他に別のセンサを用いることができるかを検討する.それが可能であれば,複数のインタフェースが可能な汎用性の高いシステムとなることも期待できる.二つ目は,聴取者に提示した結果が,現在適切に評価されていないため,主観評価実験を実施し,システムの実際の動作として,複数の聴取者が同じ音空間を共有しているかの評価を検証する予定である.
|
Expenditure Plans for the Next FY Research Funding |
該当なし
|
Research Products
(1 results)