研究概要 |
ネットワークを介した遠隔地間の協調作業においてコミュニケーションを自然に行うためには,音声を明瞭に伝送するだけではなく,音の到来方向および距離という「三次元空間情報」を正しく伝送・再生することが極めて重要であると考えられる.そこで,本研究は,バイノーラル再生系を利用して,音の三次元空間情報を受信側において自由に再構成する手法を確立することを目的とし,本年度は以下の成果を得た. まず,テレビ会議において複数話者が同時に発声する状況を取り上げ,従来法であるモノラル系システレオ系と本研究で提案した方法の結果を比較することによって,音の三次元空間情報を正しく伝送することの効果を検証した.具体的には,送信側において3名の話者が4モーラの単語を同時に発声し,受信側では予め指定された話者の発声した単語を聞き取りかなで回答した.の回答結果から単語了解度を算出した.その結果,提案法を用いた場合には,単語了解度が従来法に比べて20%程度向上することが示され,音の空間情報を正しく伝達することの有効性が示された. 続いて,提案法において音の空間情報を再構成するための音響特性補正項の特性を検証した.そのために,その補正項の物理的特性の劣化が主観的評価に及ぼす影響を調べた.具体的には,その補正項の時間領域における表現であるインパルス応答を有限長で打ち切った場合に,再生された音の聞こえにおける自然性を評価する実験を行った.その結果,本来の継続時間の1/10程度の長さでインパルス応答を打ち切っても,その自然性には有意な影響はないことが示された.一方で,その補正項を送信側の音場とは極端に音響特性が異なる音場で測定した場合には,自然性に有意な劣化が生じることも示された.これらの結果は,本提案法を簡略化して実用に供することの可能性と限界を示している.来年度は,さらに詳細な検討を行う予定である.
|