2015 Fiscal Year Research-status Report
Project/Area Number |
26540083
|
Research Institution | Nagoya Institute of Technology |
Principal Investigator |
徳田 恵一 名古屋工業大学, 工学(系)研究科(研究院), 教授 (20217483)
|
Co-Investigator(Kenkyū-buntansha) |
李 晃伸 名古屋工業大学, 工学(系)研究科(研究院), 准教授 (80332766)
南角 吉彦 名古屋工業大学, 工学(系)研究科(研究院), 准教授 (80397497)
山本 大介 名古屋工業大学, 工学(系)研究科(研究院), 准教授 (00402470)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | 音声合成 / 音声認識 / 音声対話 / 音声インタフェース |
Outline of Annual Research Achievements |
本研究の目的は、音声インタフェースのコンテンツ制作において、コンテンツ制作者が「しゃべる」ことにより、その音声情報を利用してコンテンツを制作できるインタフェースの構築法を確立することである。本研究目的を達成するための研究課題は、(1)音声からの様々な情報の獲得、(2)獲得情報のコンテンツへの反映、(3)実証実験および有効性の検証、の3つの課題に分類することができる。当該年度は研究課題(1)、および、研究課題(2)を中心に取り組んだ。また、より多様な音声表現を実現するために音声合成技術の高度化にも取り組んだ。 研究課題(1)については、声の大きさ、声の高さ、話速といった音声情報から、話者や感情、強調等の情報を獲得する方法について検討した。音声から話者情報などを獲得するために、ディープニューラルネットワークを用いた手法の検討を行った。話者情報などを表現するために適したディープニューラルネットワークの表現形式や利用方法について検討を行い、従来の生成モデルを用いた手法よりも高い性能を示した。研究課題(2)については、音声から韻律情報を抽出し、コンテンツの出力へ反映する手法について検討した。さらに、音声から抽出した韻律情報をコンテンツへと反映し、音声対話システムへと登録する、新たなコンテンツ制作システムを試作し、評価を行った。評価結果から、試作した登録システムを利用することでコンテンツ制作の柔軟性が向上し、より多くの情報を表現可能な音声対話システムを構築することが可能となった。音声合成技術の高度化としては、ディープニューラルネットワークを用いた音声合成や声質変換について検討を進め、より自然性の高い合成音声の生成が可能となった。これらの技術を音声インタフェースの出力モジュールとして利用することによって、より自然なインタフェースの実現が可能となる。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
当該年度は研究課題(1)音声から様々な情報を獲得する、および、研究課題(2)獲得情報のコンテンツへの反映、に取り組む計画であったが、音声から獲得した情報をコンテンツへと反映し、音声対話システムへと登録するシステムを試作することで、研究課題(3)実証実験及び有効性の検証、へと進めることができた。このため、当初の計画以上に進展しているといえる。
|
Strategy for Future Research Activity |
今後は、当該年度に引き続き、研究課題(1)音声からの様々な情報の獲得、および、研究課題(2)獲得情報のコンテンツへの反映、を進めると同時に研究課題(3)実証実験及び有効性の検証、に取り組む。より多くの情報を音声から獲得可能とし、それらの情報をコンテンツへ反映させるための技術を開発してく。さらに、獲得情報をコンテンツへ反映させる登録システムを試作し、実証実験による有効性の評価を進める。
|
Research Products
(42 results)