研究概要 |
パラ言語の理解・生成機能を実装しながら,人間と自然なリズムで会話できるコミュニケーションロボットを実現した。本年度の主な成果は以下の通り。 (1)ターンテーキングのモデル化と魅力的会話の生成:リズムあるターンテーキングが可能な会話ロボットをパーティーゲームに参加させる実験を行い,評価を行い,会話活性化に関する効果を確認した。また,魅力的な会話の実現を目的として,利用者の質問をトリガーとして,付加的な話題提供をする方式を確立し,その有効性を確認した。 (2)パラ言語生成の高度化:感情音声合成:話者の心情を「中立」の他,覚醒-睡眠,快-不快の組合せで作る4種類に分類し,それぞれに対応する音声の収録・学習に基づいて合成器を作成し,これらを場面に応じて使い分ける方式を提案した。扱う表現の多様化に伴って学習データ数が不足する傾向にあるが,モデル構造の共有化用規則を精緻化するとともに,HMM合成と典型パターンの利用のハイブリッド方式を提案することによって,品質向上を実現した。 (3)パラ言語理解の高度化:顔画像検出精度の向上:AAMに基づいて顔画像を取得するシステムにおける初期値推定精度の向上を行った。初期値が安定することによって,顔画像の抽出制度は著しく向上した。 (4)パラ言語理解の高度化:実環境音声処理:実環境における音声収集のために,マイクロホンのビーム形成について検討した。ここで急峻なビームを生成すると,ロボット・利用者の動作に伴い容易にビームが外れる。ビームの角度を広げるとき,遠方の音を広く拾う。このため,遠方にあっても角度が広がらない帯状のビーム形成技術を確立した。こういった手法はマイクロホン個体差の影響をうける。この影響の簡易で強力な補正法を実現した。あわせて,拡散性雑音の除去方式についても検討した。
|