本研究では、視覚的に分かりやすく誤り箇所およびその矯正方法を示すために,学習者の音声からその調音動作をCGアニメーションで表現する.具体的には(1)音声から調音動作を数値化した調音特徴を抽出し,(2)抽出した調音特徴をもとに調音動作を可視化したCGアニメーションを自動的に生成する.音声から調音特徴への変換は,多層ニューラルネットワークを用いる.この提案手法により,学習者の音声と教師の音声から生成したCGアニメーションを比較し,異なる点をハイライトすることで,学習者は誤った発音を矯正するためにどの調音器官をどのように動作させればよいのか容易に理解することができる.
|