Research Abstract |
低ビットレート用動画像符号化方式として,人物領域および背景領域に対応した処理を行う符号化を検討している.人間がテレビ電話などの動画像伝送システムを使用している時,主に対話相手を見ていると考えられる.従って,人物領域の画質を向上させれば,背景領域の画質が少々悪くても復号画像に対する主観評価の向上が期待できる.本研究では,(1)人間が注視している人物領域の画質が,全体の画質評価に与える影響,(2)背景領域の画質が,全体の画質に与える影響,(3)背景領域の種類による背景の重要度,の調査を目的とする.テレビ電話による対面コミュニケーションでは,対話者間で音声情報と画像情報の交換を行う.音声は言語情報を伝達し,画像は非音声言語情報であるノンバーバル言語を伝える.ノンバーバル言語は,表情,手振りなど会話時に交換されるコミュニケーションための非音声の情報である.テレビ電話におけるノンバーバル言語の伝達モデルを提案した. 提案したノンバーバル言語伝達モデルに基づき,画像上の領域のノンバーバル言語の表現に対する重みを測定した.対象とした領域は,人物領域では,頭部(目,鼻,口,眉,髪,その他),胴体部(首,手,腕,その他)および背景である.測定の結果,目,口,手の領域の重みが,最大0.7程度,背景の重みは,0.1程度であることが分かった.従って,研究目的の(1)と(2)については,人物領域の目などのノンバーバル言語伝達における重みが大きく,背景領域でも重みは零ではないため,背景領域も伝送する必要があると考えられる. 目的(3)については,時間が無くなったため,今回は実験が行えなかった.今後の課題としては,種々の背景のテスト画像による測定を行い,背景の重みが背景の種類で変化するかを確認することである.
|