研究課題/領域番号 |
17K20004
|
研究種目 |
挑戦的研究(萌芽)
|
配分区分 | 基金 |
研究分野 |
人間情報学およびその関連分野
|
研究機関 | 名古屋工業大学 |
研究代表者 |
徳田 恵一 名古屋工業大学, 工学(系)研究科(研究院), 教授 (20217483)
|
研究分担者 |
南角 吉彦 名古屋工業大学, 工学(系)研究科(研究院), 准教授 (80397497)
|
研究期間 (年度) |
2017-06-30 – 2020-03-31
|
研究課題ステータス |
完了 (2019年度)
|
配分額 *注記 |
6,370千円 (直接経費: 4,900千円、間接経費: 1,470千円)
2019年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
2018年度: 2,210千円 (直接経費: 1,700千円、間接経費: 510千円)
2017年度: 2,210千円 (直接経費: 1,700千円、間接経費: 510千円)
|
キーワード | 音声合成 / 音声情報処理 / ニューラルネットワーク / 調音モデル |
研究成果の概要 |
あらゆる声質を柔軟に表現可能な音声合成システムを構築するため、人間の発声機構に則した調音モデルをディープニューラルネットワークに基づいたテキスト音声合成システムに組み込んだシステムを実現した。音声品質の改善のため、WaveNetを始めとするディープニューラルネットワークに基づいた音声波形生成手法との融合を図った。さらに、敵対的学習法に基づいて合成音声の声質や感情の制御する方法の検討を行った。
|
研究成果の学術的意義や社会的意義 |
スマートフォン、スマートスピーカー等、高度な情報機器が急速に普及しつつある中で、これらの情報機器と人間との間の情報交換の方法として音声インタフェースに期待がかかっている。これらの機械と自然な会話を行うためには、出力される合成音声は自在にあらゆる声質の音声を出力し、また、様々な感情表現を行うことが必須である。本研究はこのような人間のようにしゃべる機械の実現に貢献するものである。
|