研究概要 |
質問に答えることのできる対話的な映像メディアを実現するためには,映像取得から提示までを一貫して扱う知的システムを構築することが必要である.本研究では,その一つのアプローチとして,料理や組み立て等の解説(プレゼンテーション)場面を題材とし,(1)人間の行動を知的に撮影するカメラマンの機能,(2)人間の行動を認識して映像を知的に編集するディレクターの機能,(3)映像が含んでいる情報をわかりやすく提示するマルチメディア・デザイナーの機能の3つの観点から,映像によるコミュニケーションをサポートする方法論を考え,それを検証するためのプロトタイプシステムを構築している. 各々,以下のように,順調に研究が進行している. (1)顔や手先など,撮影の主対象となる部分を複数のカメラで常に追跡して,いつでも映像として利用できる状態にする自動化撮影システムを構築した.「何をどのように伝えるか」という目的と「カメラの自動制御アルゴリズムやパラメータ」との関係を探り,不快感がなくわかりやすい映像を取得する方法を提案した. (2)人間の行動(ここではプレゼンテーションを対象)において,重要な意味を持ち,注目する必要がある場面や部分を検出する手法を提案した.注目すべき部分は,時間的・空間的に常に変化するため,「人間の行動(体の動きや発話等)を利用して,もっとも見せたい部分を検出する」ことが重要なポイントである.また,人物が持ち上げた物体などを画像認識により追跡する方法を提案した. (3)プレゼンテーションのように,はっきりとした目的がある場合,各時点の人間の行動やその他の被写体には意味や因果関係がある.それらをうまく記述して,映像をわかりやすく提示するような映像提示手法,ビデオアイコンダイアグラムの手法を提案した.これは,映像中のフレーム(画像)をアイコンとし,それを概念図のように並べることで映像の構造を表現するものである.
|