研究概要 |
代表的デジタル圧縮手法であるMPEG-1により圧縮した話者映像を用いて,ビットレート(400kbps,4000kbps)および話者映像の撮影向き(正面映像と側面映像)が映像の提示効果に与える影響について,劣性音声識別実験法により実験・検討した.その結果, (i) 話者映像効果,誤答分析,子音異聴の観点からは,400kbpsと4000kbpsの試料の間には明確な差異がない. (ii) 唇音において側面映像の話者映像効果が正面映像よりも有意に高い. という結果を得た.上記(i)の理由としては,提示した映像の冗長性の高さが考えられる.提示映像がブルーバックを背景とした話者映像であったため,映像全体としては動的要素が少なかった.従って,空間的・時間的冗長性が高く,MPEG-1において効率的に圧縮できる映像であったといえる.このため,400kbitsという低ビットレートでも圧縮時の情報の欠落が少なく,結果としてビットレート間での差異が明確に見られなかったと考えられる. そこで,空間的・時間的冗長性のより低い話者映像の一例として,CG映像と先の話者正面映像をクロマキー合成して提示映像資料とし,これを400kbpsおよび4000kbpsでMPEG-1圧縮し,同様の実験を行った.その結果,話者の口形によってもたらされる低速効果が,400kbpsでは4000kbpsに比べて有意に低くなることを示した. 今後は,MPEGエンコードにおけるオーディオ関連パラメータを変化させた場合に,話者映像効果の発現の違いを明らかにしていく.また,今後のマルチメディアコンテンツにおいては,視覚的な効果を目的として,話者の背景に様々なCG等が合成されることが予想される.そこで,話者背景としてのCGの空間的・時間的冗長性のパラメータを様々に変化させた話者映像についても吟味,比較の必要があると考える.
|