研究概要 |
自然な顔表情と顔に見合った人間らしい話し言葉を音声合成を行う擬人化エージェントの実現に必要な要素技術としてつぎの研究を行った. 1.三次元顔モデルを利用した自然な顔表情を表示する画像と,言語情報と非言語情報の両方を旨く実現するために提案した咽頭の筋肉モデルを利用した合成音声の出力のタイミングや大きさについて動的に制御を行うメディア表示システムを開発した.このシステムを,電気機器操作説明に利用し,その能力の検証を行った. 2.音声認識についてキーワードスポッティングを利用した,入力に最適な音声認識器選択手法を提案,実現を行った.これにより,状況に応じた音声認識が可能であることが分かった. 3.音声合成システムと顔動画像生成システムとを旨く同期するための基礎的理論について研究を行い,時間を考慮したスケジューリング手法,スケジュールの動的な修正手法,および,効率的な計画を行うために戦略知識の自動学習法について研究を行い,成果を得た.
|