研究課題/領域番号 |
26540092
|
研究種目 |
挑戦的萌芽研究
|
配分区分 | 基金 |
研究分野 |
知覚情報処理
|
研究機関 | 国立情報学研究所 |
研究代表者 |
佐藤 健 国立情報学研究所, 情報学プリンシプル研究系, 教授 (00271635)
|
研究分担者 |
山岸 順一 国立情報学研究所, コンテンツ科学研究系, 准教授 (70709352)
|
連携研究者 |
相澤 彰子 国立情報学研究所, コンテンツ科学研究系, 教授 (90222447)
宮尾 祐介 国立情報学研究所, コンテンツ科学研究系, 准教授 (00343096)
坊農 真弓 国立情報学研究所, コンテンツ科学研究系, 准教授 (50418521)
|
研究期間 (年度) |
2014-04-01 – 2017-03-31
|
研究課題ステータス |
完了 (2016年度)
|
配分額 *注記 |
2,730千円 (直接経費: 2,100千円、間接経費: 630千円)
2016年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2015年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2014年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
|
キーワード | 音声合成 / 話者適応 / ディープラーニング / Otopedia / オトペディア / 聴覚による学習 |
研究成果の概要 |
聴覚を利用した学習ツールのため、音声合成において話者を変換する話者適応技術の研究を進め、これまで利用した隠れマルコフモデルでなく、ディープラーニングを用いた場合でも少量の声のサンプルから声のデジタルクローンが可能であることを実験的に示した。また、音声合成における話者適応技術を利用したオーディオブックリーダiOSアプリも試作し、ePubフォーマットの電子書籍を所望の話者により読み上げることを実演した。これらの実験環境の構築により、話者の声の違いによるengagement timeの分析、そしてゆくゆくは、話者の声の違いにによりもたらされる学習や記憶への影響を調べる土台を構築することができた。
|