2018 年度実績報告書

平均声モーフィングを利用した日本語発音学習システムの研究開発

研究課題

研究課題/領域番号	16K13253
研究機関	東北大学
研究代表者	能勢隆東北大学, 工学研究科, 准教授 (90550591)
研究分担者	千葉祐弥東北大学, 工学研究科, 助教 (30780936)
研究期間 (年度)	2016-04-01 – 2019-03-31
キーワード	e-ラーニング / 語学学習支援システム(CALL) / 発音学習 / 統計的パラメトリック音声合成 / 深層学習 / 韻律置換
研究実績の概要	本課題では、日本において非母語話者が日本語の発音学習を「低コストで」「手軽に」「確実に」行えるような新たな枠組の実現を目指す。具体的には複数の教師話者の音声により学習した平均教師声モデルによる統計的パラメトリック音声合成を利用し、音声の音韻や韻律(ピッチ・リズム)を特徴量毎に置換することで、従来よりも詳細で高精度な発音スコアのラベル付けを可能とする。さらに、この技術により発音スコアデータベースを新たに構築する。このデータベースを用いて音韻、アクセント、リズムについて個別に発音スコアの予測モデルを学習し、非母語話者の発音スコアを予測することで、発音学習を効率的に行うことを目指す。さらに、平均声と利用者間で特徴量の段階的な補間を行う平均声モーフィングによる教師音声のフィートバックを行うことで、より着実に正しい発音を身につける方法を提案する。本年度は日本語音声合成において、非母語話者が聞きやすい音声の話速・ポーズ挿入位置について検討したものを論文としてまとめ公表するとともに、より聞きやすい音声を得ることを目的として、合成音声の自然性向上のため深層学習に基づいて差分特徴量に基づく制御法、および日本語アクセントの推定精度向上について取り組んだ。前者については、セグメント単位で平均化された基本周波数情報を用いて、従来の合成音声に対する差分となる特徴量を深層学習によりモデル化することで、自然性を保ちつつより柔軟な韻律の制御が可能となった。

研究成果
(5件)

すべて 2018

すべて雑誌論文 (3件) (うち査読あり 3件、オープンアクセス 3件) 学会発表 (2件) (うち国際学会 2件)

[雑誌論文] Analysis of Preferred Speaking Rate and Pause in Spoken Easy Japanese for Non-Native Listeners2018
- 著者名/発表者名
  Hafiyan Prafianto, Takashi Nose, Yuya Chiba, Akinori Ito
- 雑誌名
  
  Acoustical Science and Technology
  
  巻: 39 ページ: 92-100
- DOI
  10.1250/ast.39.92
- 査読あり / オープンアクセス
[雑誌論文] Segmental Pitch Control Using Speech Input Based on Differential Contexts and Features for Customizable Neural Speech Synthesis2018
- 著者名/発表者名
  Shinya Hanabusa, Takashi Nose, Akinori Ito
- 雑誌名
  
  Proceeding of the Thirteenth International Conference on Intelligent Information Hiding and Multimedia Signal Processing
  
  巻: - ページ: 124-131
- DOI
  10.1007/978-3-030-03748-2_15
- 査読あり / オープンアクセス
[雑誌論文] Improvement of Accent Sandhi Rules Based on Japanese Accent Dictionaries2018
- 著者名/発表者名
  Hiroto Aoyama, Takashi Nose, Yuya Chiba, Akinori Ito
- 雑誌名
  
  Proceeding of the Thirteenth International Conference on Intelligent Information Hiding and Multimedia Signal Processing
  
  巻: - ページ: 140-148
- DOI
  10.1007/978-3-030-03748-2_17
- 査読あり / オープンアクセス
[学会発表] Segmental Pitch Control Using Speech Input Based on Differential Contexts and Features for Customizable Neural Speech Synthesis2018
- 著者名/発表者名
  Shinya Hanabusa, Takashi Nose, Akinori Ito
- 学会等名
  International Conference on Intelligent Information Hiding and Multimedia Signal Processing
- 国際学会
[学会発表] Improvement of Accent Sandhi Rules Based on Japanese Accent Dictionaries2018
- 著者名/発表者名
  Hiroto Aoyama, Takashi Nose, Yuya Chiba, Akinori Ito
- 学会等名
  International Conference on Intelligent Information Hiding and Multimedia Signal Processing
- 国際学会

2018 年度 実績報告書

平均声モーフィングを利用した日本語発音学習システムの研究開発

研究代表者

能勢 隆 東北大学, 工学研究科, 准教授 (90550591)

研究成果

[雑誌論文] Analysis of Preferred Speaking Rate and Pause in Spoken Easy Japanese for Non-Native Listeners2018

著者名/発表者名

雑誌名

DOI

[雑誌論文] Segmental Pitch Control Using Speech Input Based on Differential Contexts and Features for Customizable Neural Speech Synthesis2018

著者名/発表者名

雑誌名

DOI

[雑誌論文] Improvement of Accent Sandhi Rules Based on Japanese Accent Dictionaries2018

著者名/発表者名

雑誌名

DOI

[学会発表] Segmental Pitch Control Using Speech Input Based on Differential Contexts and Features for Customizable Neural Speech Synthesis2018

著者名/発表者名

学会等名

[学会発表] Improvement of Accent Sandhi Rules Based on Japanese Accent Dictionaries2018

著者名/発表者名

学会等名

2018 年度実績報告書

能勢隆東北大学, 工学研究科, 准教授 (90550591)