2002 Fiscal Year Annual Research Report
Project/Area Number |
13650404
|
Research Institution | University of Yamanashi |
Principal Investigator |
小澤 賢司 山梨大学, 工学部, 助教授 (30204192)
|
Keywords | バイノーラル再生 / 音の三次元空間情報 / インパルス応答 / 単語了解度 / H.263符合化 / テレビ会議 / スペクトル |
Research Abstract |
ネットワークを介した遠隔地間の協調作業においてコミュニケーションを自然に行うためには,音声を明瞭に伝送するだけではなく,音の到来方向および距離という「三次元空間情報」を正しく伝送・再生することが極めて重要であると考えられる.そこで,本研究は,バイノーラル再生系を基礎として,音の三次元空間情報を受信側において自由に再構成する手法を確立することを目的とした. 昨年度の成果として,テレビ会議において複数話者が同時に発声する状況においては,従来法であるモノラル系,ステレオ系より本研究で提案した方法の単語了解度が優ることを示した.ただし,昨年度は音声と同時に提示した映像はディジタルビデオ画質という高精細なものであった.一方,実際のネットワークを介した系では,画像に関しては情報圧縮を行うことによる画質の劣化は避けられない.そこで,本年度は,昨年度と同様の実験を,「画像なし」,「H.263符号化画質(画質パラメータ:3段階)」,「ディジタルビデオ画質」の5条件下で行った.その結果,画質によって音声了解度は有意に変化するものの,どの画質条件でも提案法を用いた場合には単語了解度が従来法に比べて10%程度向上することが示され,音の空間情報を正しく伝達することの有効性が示された. また,提案法において音の空間情報を再構成するための音響特性補正項の特性を検証した.昨年度までに,補正項のインパルス応答を本来の継続時間より短くなるように打ち切ることで簡略化すると,被験者によっては極端に評価が低下する場合が見られた.そこで,本年度はその原因について検討した,具体的には,聴覚末梢系の特性を計算機上に機能モデルとして実装し,簡略化による補正特性のスペクトル変化と,主観評価値の変化の対応を調べた.その結果から,補正特性のスペクトルの変化を,本提案手法を実用に供する際の性能指標として用いることが可能であることを示した.
|
Research Products
(2 results)