研究課題/領域番号 |
26540083
|
研究機関 | 名古屋工業大学 |
研究代表者 |
徳田 恵一 名古屋工業大学, 工学(系)研究科(研究院), 教授 (20217483)
|
研究分担者 |
李 晃伸 名古屋工業大学, 工学(系)研究科(研究院), 准教授 (80332766)
南角 吉彦 名古屋工業大学, 工学(系)研究科(研究院), 准教授 (80397497)
山本 大介 名古屋工業大学, 工学(系)研究科(研究院), 准教授 (00402470)
|
研究期間 (年度) |
2014-04-01 – 2017-03-31
|
キーワード | 音声合成 / 音声認識 / 音声対話 / 音声インタフェース |
研究実績の概要 |
本研究の目的は、音声インタフェースのコンテンツ制作において、コンテンツ製作者が「しゃべる」ことにより、その音声情報を利用してコンテンツを制作できるインタフェースの構築法を確立することである。本研究目的を達成するための研究課題は、(1)音声からの様々な情報の獲得、(2)獲得情報のコンテンツへの反映、(3)実証実験及び有効性の検証、の3つの課題に分類することができる。当該年度は研究課題(1)を中心に進めていくと同時に、音声認識、音声合成、音声対話等の基盤技術の高度化にも取り組んだ。 研究課題(1)については、声の大きさ、声の高さ、話速といった音声情報から、話者や感情、強調等の情報を獲得する方法について検討した。因子分析に基づく音声モデルを用いることによって、発話に含まれる様々な情報を低次元の特徴量に抽出することを実現した。このような特徴量を利用、調整することによって様々な声質を再現可能であるため、獲得情報をコンテンツへ再現することが可能となる。また、実際の発話から韻律情報を抽象化して抽出する方法についても検討を行った。これらの手法については、研究課題(2)である獲得情報のコンテンツへの反映についても検討を進めた。実験の結果から、コンテンツ製作者がコンテンツの出力である合成音声の声質を柔軟に変更可能であることを示し、当初の計画以上に課題を進めることができたといえる。今後は、音声からの情報の獲得方法の検討を進めるとともに、獲得情報を柔軟にコンテンツへ反映していくための枠組みについて検討を進める。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
当該年度は研究課題(1)音声から様々な情報を獲得する、を中心として研究課題(2)獲得情報のコンテンツへの反映、について準備を進める計画であったが、研究課題(1)によって獲得した情報をコンテンツへと反映し、出力音声を調整する枠組みを実際に構築し、実験による評価にまで進めることができた。このため、当初の計画以上に進展しているといえる。
|
今後の研究の推進方策 |
今後は、当該年度に引き続き、研究課題(1)音声からの様々な情報の獲得、及び、研究課題(2)獲得情報のコンテンツへの反映を進める。特に、研究課題(2)については、より多様な表現を可能にするために音声合成技術の高度化に取り組むことで、より多くの情報をコンテンツへ反映する方法を検討していく。さらに、提案法全体の有効性を検証するための実証実験の準備を進める。
|
次年度使用額が生じた理由 |
当初、モデル学習用計算サーバを購入予定であったが、想定よりも納品に時間がかかったため、次年度処理としたことが理由である。
|
次年度使用額の使用計画 |
次年度に購入予定であったモデル学習用計算サーバを購入するために使用する。
|