研究概要 |
本研究では,パラ言語生成・理解の処理方式,および言語・パラ言語の連携処理を高度化することで,人間と自然なリズムで会話できるコミュニケーションロボットを実現するとともに,この機能を組み込んだロボットを用いた会話実験を通じて,ターンテーキング(発話の番の交代)のモデルを精緻化することを目的とする。 上記目的実現のため,本年度は主に要素技術の機能拡張を行った。研究の実施概要は以下のとおりである。 (1)ターンテーキングのモデル化:相手の表現の意図を早期かつ正確に確定する枠組みをWFSTに基づいて構築した。特に,断片化した発話を高精度で認識するアルゴリズムを開発した。また,これを用いて,会話システムのプロトタイプを構成した。 (2a)パラ言語生成の高度化(パラ言語生成のための声質・韻律制御):声優の発話を題材として,特に距離感を表現する音声のもつべき特徴とその合成方式について検討した。HMM合成とSTRAIGHT方式の組み合わせにより,距離感を生成するための必要条件を整理した。 (2b)パラ言語生成の高度化(動作制御):表現力を向上するため,ロボットハードウェアの再設計を行った。(当初,手腕部の作成を予定していたが,全体的な再設計を行った。) (3a)パラ言語理解の高度化(画像処理の精度向上):画像処理によるパラ言語理解処理の向上のために,同時に多方向から顔画像を収集できる装置を設計・制作した。 (3b)パラ言語理解の高度化(実環境における音声処理の精度向上):音声収録のためのハードウェアの実装を行った。申請者らが,携帯電話用に開発した処理アルゴリズムを基礎として用いることで,指向性雑音と拡散性雑音の処理アルゴリズムを実装し,これにロボットの自発話,動作音等の除去アルゴリズムを組み込み,実環境で安定して動作するシステムを構築した。
|