研究課題/領域番号 |
16K13253
|
研究機関 | 東北大学 |
研究代表者 |
能勢 隆 東北大学, 工学研究科, 准教授 (90550591)
|
研究期間 (年度) |
2016-04-01 – 2019-03-31
|
キーワード | e-ラーニング / コンピュータ支援学習(CALL) / 発音学習 / 統計的パラメトリック音声合成 / 深層学習 / 韻律置換 |
研究実績の概要 |
本課題では、日本において非母語話者が日本語の発音学習を「低コストで」「手軽に」「確実に」行えるような新たな枠組の実現を目指す。具体的には複数の教師話者の音声により学習した平均教師声モデルによる統計的パラメトリック音声合成を利用し、音声の音韻や韻律(ピッチ・リズム)を特徴量毎に置換することで、従来よりも詳細で高精度な発音スコアのラベル付けを可能とする。さらに、この技術により発音スコアデータベースを新たに構築する。このデータベースを用いて音韻、アクセント、リズムについて個別に発音スコアの予測モデルを学習し、非母語話者の発音スコアを予測することで、発音学習を効率的に行うことを目指す。さらに、平均声と利用者間で特徴量の段階的な補間を行う平均声モーフィングによる教師音声のフィードバックを行うことで、より着実に正しい発音を身につける方法を提案する。本年度(初年度)は音韻、アクセント、リズム毎の正確な発音スコアのラベル付けを行うための特徴量置換法を提案し、この手法を用いて非日本語母語話者の単語音声の主観評価を行い、有効性を示した。具体的には、従来に比べ、ラベラー内、およびラベラー間でばらつきの少ない発音スコアが得ることができ、発音スコアデータベースを構築する際に有効であることがわかった。また、アクセントについて発音スコアデータベースを作成し、アクセントスコアの予測実験を行い、従来より高精度な予測スコアが得られることを示した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
予定していた平均声を用いた韻律置換についての検討も完了し、小規模ではあるが発音スコアデータベースの構築も完了し、それを用いたアクセントスコア予測を行うことができたため。
|
今後の研究の推進方策 |
次年度は韻律置換を用いてさらに大規模な発音スコアデータベースの構築を予定している。また、これを用いて音韻、アクセント、リズムについて発音スコアの予測モデルを学習し、スコア予測性能の評価を行う。
|
次年度使用額が生じた理由 |
予定していた発音スコアデータベース構築作業のための予備実験のための費用を抑えることができたため。
|
次年度使用額の使用計画 |
発音スコアデータベース構築の規模を大きくする予定である。
|