研究概要 |
本年度は, フレームワークの改良及び, 開発したフレームワークを応用し, 下記のシステムの構築・評価実験を行った. (1) 上体輪郭追跡システム 主に会話ロボットなどが, コミュニケーションを取る相手を発見したり, 対象者の注意方向を認識するため, カメラで取得した画像中における人の認識と, その姿勢推定を行うシステムの開発を行った. 具体的には, 上体の輪郭モデルを構築し, 顔モデルのフィッティングにおいて高い性能を示しているActive Appearance Modelsの手法をもとに, エッジ画像を用いてフィッティングを行う手法を提案した. 顔モデルと上体輪郭モデルを同時に用いることで高精度なフィッティング・追跡が可能となった. (2) 音声対話システム 開発したフレームワークを用いて, (1)を含む画像処理システム(他に個人認識システムなど)と音声認識システムを統合し, 会話ロボット用の音声対話システムを構築した. 音声認識システムは,会話の複数の局面用に用意された認識対象文を同時に認識し, 対話制御システムと連携する. 以上の基本システムを元に, 応用システムとして, 会話ロボットが人同士のコミュニケーションを活性化するシステムを構築した. 具体的には, 進行役と複数の回答者が存在するクイズ形式のコミュニケーションに, 回答者の一人として参加することで, 場を盛り上げるシステムである. 効果的に場を盛り上げるためには, 回答者の活性度を場の状況から正確に推定する必要があり, 本研究で構築したフレームワークを用いて音声認識, 顔方向認識, ゲーム進行状況等を高度に連携させることではじめて実現可能となった.
|