研究概要 |
本課題においては,会話システムにおける,ターンテーキングの高度化,パラ言語生成の高度化,パラ言語理解の高度化をテーマとして研究を進めている。 ターンテーキングの高度化については,並行して動作する認識器群(WFSTベースのものと,Ngramベースのもの)を用いて,対応可能な話題遷移を多様化することを試みた。このシステム上で,ターンテーキングのパラメタを様々に変えて実験を行い,自然な会話に必要となる条件について検討した。 パラ言語生成の高度化については,主に声質・韻律の制御手法と,動作の表現手法について検討を行った。性質制御については,話者の心情をニュートラルの他,4種類(覚醒-睡眠,快-不快の組み合わせで作られる4種類)用意し,対話の場面に応じてこれらを使い分けることを試みた。このことによって,従来に比べ対話の自然性を向上できることを確認した。また,遠くの人に呼びかける場合の声と近くの人に話す場合の声を使いわけるなど,発話に距離感を与える手法についても検討を行った。動作制御については,状況と動作の役割の関係性を記述する言語を設計し,この記述に基づいて,不適切な役割を生じさせる動作を排除する仕組みを実現した。 パラ言語理解の高度化に関しては,昨年設計・一部製作を行った多方向から一度に顔画像を取得する装置を完成させ,これを用いて顔画像データベースの構築を開始した。今後このデータベースを用いて,顔認識の精度向上に役立てる予定である。また,音声認識における雑音処理の高度化についても検討を行った。特に,ビームフォーマの形状が扇状であるためビーム幅が遠方において広がり,雑音抑圧性能が落ちてしまう問題に対し,帯状のビームを形成する手法を提案し,これを解決した。
|