研究概要 |
一般に,外国語学習支援(CALL : Computer-Assisted Language Learning)システムにおいては,教師と学習者の声の個人性,つまり話者性を取り除く必要がある.そこで本研究では,この問題を解決するための一手段として,学習者の音声から外国語発音音声ターゲットの生成とその手法を応用した発音誤り判定について検討してきた. 1.音声の話者性に関する研究として,ある話者が発声した音声を他の話者が発声したかのように聞こえるよう変換する声質変換がある.本研究では,前年度に開発した声質変換技術を用いて学習者からの外国語発音ターゲットの生成を行い、発音評価のための話者性抑圧効果を得ることを試みた.そのために、混合正規分布モデル(GMM : Gaussian Mixture Model)に基づく声質変換法を,高性能な分析合成方式であるSTRAIGHT(Speech Transformation and Representation using Adaptive Interoperation of weighTed spectrum)に適用し,さらにスペクトルの周波数軸伸縮と変換スペクトルの混合を行うことで,高品質な声質変換システムの構築を行なった。その結果,同一言語間において,従来よりもよい音質を持ち,かつ同程度の話者性を保持した変換音声を合成することに成功した. 2.日英のバイリンガル話者の音声を収録し、バイリンガル音声データベースを作成した。このバイリンガル話者の日本語音声と、英語学習者の同じ日本語音声を用いて声質変換のパラメータを学習する.この変換パラメータを用いて、バイリンガル話者の英語を英語学習者の声質の英語音声に変換する。日英言語間にわたる声質変換の有効性を主観評価実験によって確認した. 3.さらに,学習者の発音誤り抽出のために声質変換法を応用することを考え,話者性抑圧を行って客観評価尺度と主観的な発音評価との関係を調べた.この予備実験では,完全な発音誤りに関して,話者性抑圧効果による有意差が見られた. 今後は,異なる言語間にわたる変換アルゴリズムのさらなる改良,子音の発音誤り評価の検討,そしてより多くのバイリンガル音声と学習者音声を収集することにより,実用的な学習支援法の開発を行う.
|