• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2016 年度 実績報告書

発声障害者のための高品質かつ柔軟な音声合成技術の確立

研究課題

研究課題/領域番号 15J10727
研究機関奈良先端科学技術大学院大学

研究代表者

田中 宏  奈良先端科学技術大学院大学, 情報科学研究科, 特別研究員(DC2)

研究期間 (年度) 2015-04-24 – 2017-03-31
キーワード統計的電気音声発声 / 無喉頭音声 / 電気音声 / 電気式人工喉頭 / 統計的音源予測 / 生成モデル
研究実績の概要

本年度の業績は,査読付き英語論文1本,査読付き国際会議2本,国内会議1本である.
本研究課題は,「発声障害者のための高品質かつ柔軟な音声合成技術の確立」である.本年度は,(1)統計的電気音声発声(実時間版)のためのモデル学習および予測手法の改善,(2)統計的電気音声発声(オフライン版)のためのモデル学習および予測手法の改善を行った.
(1)に関して,昨年度実装した入力される無喉頭音声(電気音声)から実時間予測される韻律情報(F0 パターン)に応じて電気式人工喉頭を直接制御する枠組み(実時間統計的電気音声発声)において,先読み予測および学習する特徴量を工夫することにより,韻律情報の予測精度を改善した.また,主観評価実験においても,従来の電気音声と比較して,大幅な自然性の改善を確認した.なお,以上の内容をまとめた論文を,電子情報通信学会の英語論文誌に投稿し,採択された.
(2)に関して,オフライン版の予測精度は実時間版の予測精度の上限値となるため,オフライン版の予測精度改善は必要である.本年度は,入力される電気音声からF0 パターンを予測するためのオフライン版の統計モデルを新たに提案した.従来の統計モデルを用いて予測されるF0パターンは入力された電気音声に対して最尤であるが,時として人が発声し得ない不自然なF0パターンとなってしまう.この問題に対して,F0パターンの物理的な生成過程の制約を導入することで,電気音声に対応する自然な(人が生成し得る)F0パターンを統計的に予測する手法を提案した.評価実験により制約を組み込んだ予測処理を可能とすることで,F0パターンの予測精度を改善することを確認した.

現在までの達成度 (段落)

28年度が最終年度であるため、記入しない。

今後の研究の推進方策

28年度が最終年度であるため、記入しない。

  • 研究成果

    (5件)

すべて 2017 2016 その他

すべて 雑誌論文 (1件) (うち国際共著 1件、 査読あり 1件、 オープンアクセス 1件、 謝辞記載あり 1件) 学会発表 (3件) (うち国際学会 2件) 備考 (1件)

  • [雑誌論文] A Vibration Control Method of an Electrolarynx based on Statistical F0 Pattern Prediction2017

    • 著者名/発表者名
      Kou Tanaka, Tomoki Toda, and Satoshi Nakamura
    • 雑誌名

      IEICE Transactions Information and Systems

      巻: E100-D ページ: 印刷中

    • 査読あり / オープンアクセス / 国際共著 / 謝辞記載あり
  • [学会発表] F0パターン生成過程の確率モデルに基づく電気音声に対するフレーズ・アクセント指令推定2017

    • 著者名/発表者名
      田中 宏,亀岡 弘和, 戸田 智基,中村 哲
    • 学会等名
      日本音響学会春季研究発表会
    • 発表場所
      明治大学生田キャンパス(神奈川県川崎市)
    • 年月日
      2017-03-09 – 2017-03-11
  • [学会発表] Evaluation of Electrolarynx Controlled by Real-time Statistical F0 Prediction2016

    • 著者名/発表者名
      Kou Tanaka, Tomoki Toda, Sakriani Sakti, and Satoshi Nakamura
    • 学会等名
      5th Joint Meeting of the ASA and the ASJ
    • 発表場所
      Hawaii, USA
    • 年月日
      2016-11-28 – 2016-12-02
    • 国際学会
  • [学会発表] Real-time vibration control of an electrolarynx based on statistical F0 contour prediction2016

    • 著者名/発表者名
      Kou Tanaka, Tomoki Toda, Graham Neubig and Satoshi Nakamura
    • 学会等名
      Proc. EUSIPCO
    • 発表場所
      Budapest, Hungary
    • 年月日
      2016-08-29 – 2016-09-02
    • 国際学会
  • [備考] 知能コミュニケーション研究室HP

    • URL

      http://ahclab.naist.jp

URL: 

公開日: 2018-01-16  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi