• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2016 年度 実績報告書

耳からの知識獲得otopediaの研究

研究課題

研究課題/領域番号 26540092
研究機関国立情報学研究所

研究代表者

佐藤 健  国立情報学研究所, 情報学プリンシプル研究系, 教授 (00271635)

研究分担者 山岸 順一  国立情報学研究所, コンテンツ科学研究系, 准教授 (70709352)
研究期間 (年度) 2014-04-01 – 2017-03-31
キーワード音声合成 / 話者適応 / ディープラーニング / オトペディア
研究実績の概要

聴覚を利用した学習ツールは、満員電車での通勤時やジョギング時に使えるので、効率的な学習として非常に役に立つ。そして、近年そのようなコンテンツを高速に多量に生成できる音声合成ツールが開発されており、このようなツールの開発は加速されると考える。この研究では、聴覚を利用した学習教材に関して、記憶に効果的な情報提示法の研究および、そのような情報提示法を利用した学習ツールの効果の科学的実証を目的とした。しかしながら、情報提示法の部分で、聴覚学習モデルの構築が必要であることが判明したため、まず、それに対応するようなツールを作成することに研究計画を変更した。そこで、音声合成において話者を変換する話者適応技術の研究を進め、これまで利用した隠れマルコフモデルでなく、ディープラーニングを用いた場合でも少量の声のサンプルから声のデジタルクローンが可能であることを実験的に示した。その他、音声合成において自然な韻律を生成する AUTO REGRESSIVE RECURRENT MIXTURE DENSITY NETWORKという新たなモデルの提案及び実験も行った。また、音声合成における話者適応技術を利用したオーディオブックリーダiOSアプリも試作し、ePubフォーマットの電子書籍を所望の話者により読み上げることを実演した。これらの実験環境の構築により、話者の声の違いによるengagement timeの分析、そしてゆくゆくは、話者の声の違いにによりもたらされる学習や記憶への影響を調べる土台を構築することができた。

備考

受賞: 2016年12月 日本学術振興会日本学術振興会賞 山岸順一 統計的音声合成における話者適応とその応用
メディア報道:NHK「くらし解説」2017年3月3日,進化する合成音声, Forbes Japan 2016年8月19日, 声を失った人が「自分の声で会話する」方法はあるのか?

  • 研究成果

    (2件)

すべて 2017 2016

すべて 雑誌論文 (1件) (うち国際共著 1件、 査読あり 1件) 学会発表 (1件) (うち国際学会 1件)

  • [雑誌論文] A DNN-based text-to-speech synthesis system using speaker, gender, and age codes2016

    • 著者名/発表者名
      Luong, H. T., Takaki, S., Kim, S.J., Ymagishi, J.
    • 雑誌名

      The Journal of the Acoustical Society of America

      巻: 140 ページ: -

    • DOI

      10.1121/1.4969152

    • 査読あり / 国際共著
  • [学会発表] AN AUTO REGRESSIVE RECURRENT MIXTURE DENSITY NETWORK FOR PARAMETRIC SPEECH SYNTHESIS2017

    • 著者名/発表者名
      Xin Wang, Shinji Takaki, Junichi Yamagish
    • 学会等名
      The 42nd IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2017)
    • 発表場所
      HILTON NEW ORLEANS RIVERSIDE (New Orleans, USA)
    • 年月日
      2017-03-05 – 2017-03-09
    • 国際学会

URL: 

公開日: 2018-01-16  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi