研究課題/領域番号 |
14580416
|
研究機関 | 山梨大学 |
研究代表者 |
関口 芳廣 山梨大学, 工学部, 教授 (70020493)
|
研究分担者 |
鈴木 良弥 山梨大学, 工学部, 助手 (20206551)
有泉 均 山梨大学, 工学部, 講師 (80020436)
唐澤 博 山梨大学, 工学部, 助教授 (90177618)
|
キーワード | 音声対話 / 複数話者 / 話題の同定 / 感情音声合成 / 音源方向識別 / 話者識別 / 言語情報処理 / 対話管理 |
研究概要 |
複数の話者と対話できるロボットの構築を目指して研究を行っている。その結果、下記のような研究成果を得た。 1)2名の話者が自由に発話した音声を、マイクロホンアレーを利用して入力し、音源方向をほぼ実時間で識別できる手法を開発した。この方法の特徴は、低い周波数でサンプリングしても、音源方向を正確に識別できること、ロボットと話者の距離が約3m以内なら正確な識別が可能なこと、障害物の存在や反射物の存在にも影響され難いことなどである。 2)発話全体と有声音部に対して、それぞれ話者識別を行い、その結果を利用して最終決定を行う話者識別方法の導入で、極短い発話に対してもほぼ正確に話者を識別できるようになった。 3)重複した音声の分離には音声の到来方向の情報を利用している。簡便な方法ではあるが、重なり部分が少ない音声に対してはある程度効果がある。 4)対話管理では、2名の話者の発話内容の理解と適切な応答文生成を行う。会話にロボットが割り込み、適切な発話を行う手法を考案し、実現させている。割り込みのタイミングと発話内容の適切さが必要であるが、時には冗談の挿入等冗長な会話を挿入して、より自然な対話状況を作るようにしている。 5)感情や個人性を含む音質を生成できるよう、音源及びホルマント周波数、基本周波数の新しい制御方法を考案した。その結果、非常に変化に富んだ音声を生成できるようになった。 6)適切な応答のため、知識の整理、情報検索手法を検討し、発話内容を話題ごとに分類できるようになった。 7)連想等の高次の言語情報を利用して、音声認識をより正確に行える方法を検討し、予備実験の結果では効果を確かめている。
|