Project/Area Number |
15J10727
|
Research Category |
Grant-in-Aid for JSPS Fellows
|
Allocation Type | Single-year Grants |
Section | 国内 |
Research Field |
Perceptual information processing
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
田中 宏 奈良先端科学技術大学院大学, 情報科学研究科, 特別研究員(DC2)
|
Project Period (FY) |
2015-04-24 – 2017-03-31
|
Project Status |
Completed (Fiscal Year 2016)
|
Budget Amount *help |
¥1,900,000 (Direct Cost: ¥1,900,000)
Fiscal Year 2016: ¥900,000 (Direct Cost: ¥900,000)
Fiscal Year 2015: ¥1,000,000 (Direct Cost: ¥1,000,000)
|
Keywords | 統計的電気音声発声 / 無喉頭音声 / 電気音声 / 電気式人工喉頭 / 統計的音源予測 / 生成モデル / 喉頭摘出者 / 音声合成 / 基本周波数 |
Outline of Annual Research Achievements |
本年度の業績は,査読付き英語論文1本,査読付き国際会議2本,国内会議1本である. 本研究課題は,「発声障害者のための高品質かつ柔軟な音声合成技術の確立」である.本年度は,(1)統計的電気音声発声(実時間版)のためのモデル学習および予測手法の改善,(2)統計的電気音声発声(オフライン版)のためのモデル学習および予測手法の改善を行った. (1)に関して,昨年度実装した入力される無喉頭音声(電気音声)から実時間予測される韻律情報(F0 パターン)に応じて電気式人工喉頭を直接制御する枠組み(実時間統計的電気音声発声)において,先読み予測および学習する特徴量を工夫することにより,韻律情報の予測精度を改善した.また,主観評価実験においても,従来の電気音声と比較して,大幅な自然性の改善を確認した.なお,以上の内容をまとめた論文を,電子情報通信学会の英語論文誌に投稿し,採択された. (2)に関して,オフライン版の予測精度は実時間版の予測精度の上限値となるため,オフライン版の予測精度改善は必要である.本年度は,入力される電気音声からF0 パターンを予測するためのオフライン版の統計モデルを新たに提案した.従来の統計モデルを用いて予測されるF0パターンは入力された電気音声に対して最尤であるが,時として人が発声し得ない不自然なF0パターンとなってしまう.この問題に対して,F0パターンの物理的な生成過程の制約を導入することで,電気音声に対応する自然な(人が生成し得る)F0パターンを統計的に予測する手法を提案した.評価実験により制約を組み込んだ予測処理を可能とすることで,F0パターンの予測精度を改善することを確認した.
|
Research Progress Status |
28年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
28年度が最終年度であるため、記入しない。
|