研究概要 |
ネットワークを介した遠隔地間の協調作業においてコミュニケーションを自然に行うためには,音声を明瞭に伝送するだけではなく,音の到来方向および距離という「三次元空間情報」を正しく伝送・再生することが重要であると考えられる.そこで,本研究は,バイノーラル再生系を基礎として,音の三次元空間情報を受信側において自由に再構成する手法を確立するために以下の二つの観点から研究を実施した. (1)送信側における音の三次元空間情報の受信側における忠実再生 本研究の提案法における,音の空間情報を再構成するための音響特性補正項について,その特性を検証するために,その補正項の物理的特性の劣化が主観的評価に及ぼす影響を調べた.具体的には,その補正項の時間領域における表現であるインパルス応答を有限長で打ち切った場合に,再生された音の聞こえにおける自然性を評価する実験を行った.その結果,本来の継続時間の1/10程度の長さでインパルス応答を打ち切っても,その自然性には有意な影響はないことが示された.これにより,本研究で提案した手法を実用に供する可能性を実証した. (2)受信側における三次元空間情報の再構成 テレビ会議において競合話者が同時に発声する状況を取り上げ,従来法であるモノラル系,ステレオ系と本研究で提案した方法の結果を比較することによって,音の三次元空間情報を正しく伝送することの効果を検証した.具体的には,送信側において3名の話者が4モーラの単語を同時に発声し,受信側では予め指定された話者の発声した単語を聞き取りかなで回答した.その回答結果から単語了解度を算出した.その結果,提案法を用いた場合には,単語了解度が従来法に比べて20%程度向上することが示され,音の空間情報を正しく伝達することの有効性が示された.さらに,この効果は,同時に伝送する映像情報の画質によらず有効であることも示された.
|