1998 Fiscal Year Annual Research Report
デジタル圧縮・再生映像の話者映像効果における感性因子の研究
Project/Area Number |
09838020
|
Research Institution | Kyoto Institute of Technology |
Principal Investigator |
田村 博 京都工芸繊維大学, 大学院・工芸科学研究科, 教授 (70029411)
|
Co-Investigator(Kenkyū-buntansha) |
渋谷 雄 京都工芸繊維大学, 工芸学部, 助教授 (70226190)
|
Keywords | 話者映像効果 / 劣勢音声識別実験法 / MPEG / 誤答分析 / 異聴 / 低速効果 / 高速効果 / 感性 |
Research Abstract |
代表的デジタル圧縮手法であるMPEG-1により圧縮した話者映像を用いて,ビットレート(400kbps,4000kbps)および話者映像の撮影向き(正面映像と側面映像)が映像の提示効果に与える影響について,劣性音声識別実験法により実験・検討した.その結果, (i) 話者映像効果,誤答分析,子音異聴の観点からは,400kbpsと4000kbpsの試料の間には明確な差異がない. (ii) 唇音において側面映像の話者映像効果が正面映像よりも有意に高い. という結果を得た.上記(i)の理由としては,提示した映像の冗長性の高さが考えられる.提示映像がブルーバックを背景とした話者映像であったため,映像全体としては動的要素が少なかった.従って,空間的・時間的冗長性が高く,MPEG-1において効率的に圧縮できる映像であったといえる.このため,400kbitsという低ビットレートでも圧縮時の情報の欠落が少なく,結果としてビットレート間での差異が明確に見られなかったと考えられる. そこで,空間的・時間的冗長性のより低い話者映像の一例として,CG映像と先の話者正面映像をクロマキー合成して提示映像資料とし,これを400kbpsおよび4000kbpsでMPEG-1圧縮し,同様の実験を行った.その結果,話者の口形によってもたらされる低速効果が,400kbpsでは4000kbpsに比べて有意に低くなることを示した. 今後は,MPEGエンコードにおけるオーディオ関連パラメータを変化させた場合に,話者映像効果の発現の違いを明らかにしていく.また,今後のマルチメディアコンテンッにおいては,視覚的な効果を目的として,話者の背景に様々なCG等が合成されることが予想される.そこで,話者背景としてのCGの空間的・時間的冗長性のパラメータを様々に変化させた話者映像についても吟味,比較の必要があると考える.
|
Research Products
(4 results)
-
[Publications] 呉 俊: "音声識別における顔映像の役割" 電子情報通信学会論文誌. J80-D-II・8. 2066-2073 (1997)
-
[Publications] 都築 達郎: "単語音声識別における静止映像の提示効果" Human Interface. 13. 457-462 (1997)
-
[Publications] 古江 伸樹: "劣性音声識別実験法を用いたMPEG-1映像の品質評価" Human Interface. 14. 565-570 (1998)
-
[Publications] 都築 達郎: "MPEG-1圧縮した正面映像と側面映像の話者映像効果の比較" 日本人間工学会関西支部大会講演論文集. 93-98 (1998)