• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2019 年度 研究成果報告書

ディープニューラルネットワークにより学習可能な調音モデルに基づいた音声合成

研究課題

  • PDF
研究課題/領域番号 17K20004
研究種目

挑戦的研究(萌芽)

配分区分基金
研究分野 人間情報学およびその関連分野
研究機関名古屋工業大学

研究代表者

徳田 恵一  名古屋工業大学, 工学(系)研究科(研究院), 教授 (20217483)

研究分担者 南角 吉彦  名古屋工業大学, 工学(系)研究科(研究院), 准教授 (80397497)
研究期間 (年度) 2017-06-30 – 2020-03-31
キーワード音声合成 / 音声情報処理
研究成果の概要

あらゆる声質を柔軟に表現可能な音声合成システムを構築するため、人間の発声機構に則した調音モデルをディープニューラルネットワークに基づいたテキスト音声合成システムに組み込んだシステムを実現した。音声品質の改善のため、WaveNetを始めとするディープニューラルネットワークに基づいた音声波形生成手法との融合を図った。さらに、敵対的学習法に基づいて合成音声の声質や感情の制御する方法の検討を行った。

自由記述の分野

音声情報処理

研究成果の学術的意義や社会的意義

スマートフォン、スマートスピーカー等、高度な情報機器が急速に普及しつつある中で、これらの情報機器と人間との間の情報交換の方法として音声インタフェースに期待がかかっている。これらの機械と自然な会話を行うためには、出力される合成音声は自在にあらゆる声質の音声を出力し、また、様々な感情表現を行うことが必須である。本研究はこのような人間のようにしゃべる機械の実現に貢献するものである。

URL: 

公開日: 2021-02-19  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi