本研究は、俗に「ため口」と呼ばれる敬意表現を伴わない仲間内での会話に用いられる発話様式に着目し、「ため口」の処理を通してこれまでの音声処理で軽視されがちであったパラ言語情報を利用する技術の開発を目的としている。平成14年度の研究計画は、大略以下の通り。 1 ため口を認識する音声対話システムの作成 2 ため口による音声レスポンスの生成 このうち1については会議室予約をタスクとした音声対話システムの製作を完了し、6名の被験者による印象評価実験を行った。このシステムは頑健な文節スポッティングと意味解析に基づいており、通常のあらたまった口調のほか、ため口による発話も受理できる。エージェントに用いるキャラクターを子供のように見える親しみやすいデザインにしたほか、エージェントの発話をため口にしたことにより、ユーザの発話もほとんどがため口となり、期待した音声データが収集できた。音声認識の性能に問題があり、流暢な会話とまでは行かなかったが、これらのデータを基に今後の音声認識の改良をしていく見通しができた。 また2については、13年度の研究成果である韻律と声質の制御によるパラ言語情報の伝達に加え、話しかけやすいインタフェース実現を狙った子供の声によるレスポンス生成に関して研究を行った。その結果、当初の目標であった規則合成方式によるレスポンス生成の実現を研究期間内に完成させることはできなかったものの、子供の発声スピードに合わせて成人が発話した音声の韻律・声道パラメータ、具体的には基本周波数軌跡およびフォルマント周波数を操作することで高品質な子供の声によるレスポンスを生成することができた。この枠組は、親しみやすいエージェントにはそれにふさわしい声が要求されるという現状の音声対話システムにおける問題に対する重要な成果である。 結果として、本研究の目的の主要部分については達成されたと考えている。
|