研究課題/領域番号 |
15K12071
|
研究種目 |
挑戦的萌芽研究
|
配分区分 | 基金 |
研究分野 |
知覚情報処理
|
研究機関 | 国立情報学研究所 |
研究代表者 |
山岸 順一 国立情報学研究所, コンテンツ科学研究系, 准教授 (70709352)
|
連携研究者 |
高木 信二 国立情報学研究所, コンテンツ科学研究系, 特任助教 (50735090)
|
研究期間 (年度) |
2015-04-01 – 2017-03-31
|
研究課題ステータス |
完了 (2016年度)
|
配分額 *注記 |
3,380千円 (直接経費: 2,600千円、間接経費: 780千円)
2016年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2015年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
|
キーワード | 音声合成 / オーディオブック / 集合知 / 機械学習 / インタラクティブ / ディープラーニング / 音声情報処理 |
研究成果の概要 |
電子書籍には音声合成機能が搭載され、ユーザは電子書籍を読んで楽しむだけでなく、聞いて楽しむことも出来る。この技術に、様々な声質や発話様式による音声生成が可能な統計的音声合成を組み合わせれば、合成音声の表現をユーザ自身がインタラクティブに制御可能なプラットフォームに変わる。 この目的のため、本研究では音響モデリング技術を音声の変換関数を因子化することで高度化させた。話者の変換行列と感情の変換行列を明示的に因子化させ、ある話者から推定された感情の変換行列を、全く別の話者においても利用できる適応アルゴリズムを提案した。また話者の性別や年齢を因子化したシステムも構築した。提案オーディオブックも試作した。
|