2015 Fiscal Year Annual Research Report
状態推定に基づく多様な音声の認識・合成による「人にやさしい」対話システムの研究
Project/Area Number |
15H02720
|
Research Institution | Tohoku University |
Principal Investigator |
能勢 隆 東北大学, 工学研究科, 准教授 (90550591)
|
Co-Investigator(Kenkyū-buntansha) |
伊藤 彰則 東北大学, 工学研究科, 教授 (70232428)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | 音声対話 / 感情音声合成 / 感情認識 / 対話意欲 / 感情音声コーパス / 音韻・韻律バランス文 |
Outline of Annual Research Achievements |
今年度は以下の項目について研究成果が得られた。1. 音声対話において感情を行うことの妥当性、および感情推定法について検討を行なった。具体的にはまずは言語情報から感情を推定し、その感情に対して協調的な応答を返す場合と、ランダムな場合、入力感情とは逆の感情の応答を返した場合について対話の自然性や知的さなどの複数の主観的な評価を行い、協調的な応答が有効であることを示した。2. 音声合成部において自然性の高い音声を生成するため、従来の音韻バランスだけでなく、音韻と韻律(アクセントや文長)の両方のコンテキストを考慮した拡張エントロピーに基づく文選択方を提案し、評価実験を行なった。その結果、ランダムに文を選択した場合に比べ、有意に提案法のほうが自然性や再現性の高い合成音声が得られることがわかった。3. 対話におけるユーザの状態推定として対話意欲を対象として、実際に対話の収録を行い、得られた音声について分析・推定を行なった。その結果、ある程度対話意欲の程度に顕著な差がある場合については、対話意欲の度合いを音響的特徴などから精度よく推定できることがわかった。4. 感情を伴う音声対話における感情音声合成・感情音声認識・感情推定に利用可能な大規模な感情音声コーパスを構築するため、エントロピーを考慮した音韻・韻律バランス感情依存文の設計と予備的な評価を行なった。その後音声の収録を実際に行い、予備的な分析を行ない、音声の特性について調査した。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
各基盤要素について並列で研究を進めることができ、想定以上の成果が得られた。
|
Strategy for Future Research Activity |
引き続き、感情音声コーパスの大規模化を進め、収録した音声を用いた実験を行う。また、音声対話システムにおける応答についての検討や、音響モデルやアクセントなども含めた音声合成の性能向上、DNNに基づくリアルタイム音声認識の検討などについても研究を進める予定である。
|