研究概要 |
本研究では、ユーザが真に利用したいと思える音声対話システムの実現を目指し、システムを個性化するための技術について大規模データから知見を得ることを目的として研究を遂行した.ここで音声対話システムが個性化されているとは、 ●対話を通じてユーザの個性を抽出することができる(個性の認識) ●自らの個性を形成し、対話において個性を反映した振る舞いができる(個性の表出)という機能を備えていることをいう. 本研究では、「個性の認識」における特徴的現象として「口癖」に着目し、口癖を検出するためのモデルを開発した。複数ユーザの各発話における口癖の分布に着目して,口癖らしさを示すスコアを定め,あらゆる形態素n-gramに対して口癖スコアを求める方法を考案した.名古屋大学車内音声対話データベースのドライバ発話を用いて口癖検出実験を行い,本手法の有効性を確認した. 一方、「個性の表出」に関する特徴的現象として「あいづち」に着目し、あいづちコーパスを作成するとともに、あいづちの出現に関して分析を与えた。話し手の発話中に打つことが可能なあいづちタイミングを網羅的に明らかにすることを試みた.まず,複数の被験者によるあいづち音声を収録し,被験者全体で統合することにより,あいづちデータを作成した.次に,文節や節,ポーズ,発話速度とあいづちタイミングとの関係についてデータ分析を与えた.分析結果に基づいて実験を実施し,あいづち挿入タイミングの推定可能性について検討した.
|