2016 年度研究成果報告書

統計的音声合成を利用したインタラクティブオーディオブックと集合知への応用

研究課題

研究課題/領域番号	15K12071
研究種目	挑戦的萌芽研究
配分区分	基金
研究分野	知覚情報処理
研究機関	国立情報学研究所
研究代表者	山岸順一国立情報学研究所, コンテンツ科学研究系, 准教授 (70709352)
連携研究者	高木信二国立情報学研究所, コンテンツ科学研究系, 特任助教 (50735090)
研究期間 (年度)	2015-04-01 – 2017-03-31
キーワード	音声合成 / オーディオブック / 集合知 / 機械学習
研究成果の概要	電子書籍には音声合成機能が搭載され、ユーザは電子書籍を読んで楽しむだけでなく、聞いて楽しむことも出来る。この技術に、様々な声質や発話様式による音声生成が可能な統計的音声合成を組み合わせれば、合成音声の表現をユーザ自身がインタラクティブに制御可能なプラットフォームに変わる。この目的のため、本研究では音響モデリング技術を音声の変換関数を因子化することで高度化させた。話者の変換行列と感情の変換行列を明示的に因子化させ、ある話者から推定された感情の変換行列を、全く別の話者においても利用できる適応アルゴリズムを提案した。また話者の性別や年齢を因子化したシステムも構築した。提案オーディオブックも試作した。
自由記述の分野	音声情報処理