2001 Fiscal Year Annual Research Report
学習者の音声からの英語発音音声ターゲットの生成に関する研究
Project/Area Number |
13020229
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
鹿野 清宏 奈良先端科学技術大学院大学, 情報科学研究科, 教授 (00263426)
|
Co-Investigator(Kenkyū-buntansha) |
李 晃伸 奈良先端科学技術大学院大学, 情報科学研究科, 助手 (80332766)
川波 弘道 奈良先端科学技術大学院大学, 情報科学研究科, 助手 (80335489)
キャンベル ニック ATR音声言語通信研究所, 主幹研究員
|
Keywords | 声質変換 / 日英言語間 / バイリンガル音声データ / メルケプストラム歪み / 発音誤り検出 |
Research Abstract |
一般に,外国語学習支援(CALL : Computer-Assisted Language Learning)システムにおいては,教師と学習者の声の個人性,つまり話者性を取り除く必要がある.そこで本研究では,この問題を解決するための一手段として,学習者の音声から外国語発音音声ターゲットの生成とその手法を応用した発音誤り判定について検討してきた. 1.音声の話者性に関する研究として,ある話者が発声した音声を他の話者が発声したかのように聞こえるよう変換する声質変換がある.本研究では,前年度に開発した声質変換技術を用いて学習者からの外国語発音ターゲットの生成を行い、発音評価のための話者性抑圧効果を得ることを試みた.そのために、混合正規分布モデル(GMM : Gaussian Mixture Model)に基づく声質変換法を,高性能な分析合成方式であるSTRAIGHT(Speech Transformation and Representation using Adaptive Interoperation of weighTed spectrum)に適用し,さらにスペクトルの周波数軸伸縮と変換スペクトルの混合を行うことで,高品質な声質変換システムの構築を行なった。その結果,同一言語間において,従来よりもよい音質を持ち,かつ同程度の話者性を保持した変換音声を合成することに成功した. 2.日英のバイリンガル話者の音声を収録し、バイリンガル音声データベースを作成した。このバイリンガル話者の日本語音声と、英語学習者の同じ日本語音声を用いて声質変換のパラメータを学習する.この変換パラメータを用いて、バイリンガル話者の英語を英語学習者の声質の英語音声に変換する。日英言語間にわたる声質変換の有効性を主観評価実験によって確認した. 3.さらに,学習者の発音誤り抽出のために声質変換法を応用することを考え,話者性抑圧を行って客観評価尺度と主観的な発音評価との関係を調べた.この予備実験では,完全な発音誤りに関して,話者性抑圧効果による有意差が見られた. 今後は,異なる言語間にわたる変換アルゴリズムのさらなる改良,子音の発音誤り評価の検討,そしてより多くのバイリンガル音声と学習者音声を収集することにより,実用的な学習支援法の開発を行う.
|
Research Products
(6 results)
-
[Publications] 戸田智基, 陸金林, 猿渡洋, 鹿野清宏: "周波数軸伸縮を用いた混合正規分布モデルに基づく声質変換法"電子情報通信学会論文誌. Vol.J84-D-II, No.10. 2181-2189 (2001)
-
[Publications] Tomoki Toda, Hiroshi Saruwatari, Kiyohiro Shikano: "Conversion Algorithm Based on Gaussian Mixture Model with Dynamic Frequency Warping of STRAIGHT Spectrum"Proceedings of IEEE International Conference on Acoustics, Speech and Signal Processing. SEECH-P8. 841-844 (2001)
-
[Publications] T.Toda, H.Saruwatari, K.Shikano: "High Quality Voice Conversion Based on Gaussian Mixture Model with Dynamic Frequency Warping"Proceedings of 7th European Conference on Speech Communication and Technology. 349-352 (2001)
-
[Publications] M.Mashimo, T.Toda, K.Shikano, N.Camnpbell: "Evaluation of Cross-Language Voice Conversion Based on GMM and STRAIGHT"Proceedings of 7th European Conference on Speech Communication and Technology. 869-872 (2001)
-
[Publications] 真下美紀子, 戸田智基, 川波弘道, 鹿野清宏, Nick Campbell: "混合正規分布モデルに基づく声質変換法の日英言語間への適用"日本音響学会講演論文集. 1-P-17. 389-390 (2001)
-
[Publications] 真下美紀子, 戸田智基, 川波弘道, 鹿野清宏, ニック キャンベル: "日英言語間における声質変換と母音空間の影響に関する検討"日本音響学会講演論文集. 1-10-16. 261-262 (2002)