2004 Fiscal Year Annual Research Report
話者適応と文法誤りモデリングを用いた外国語教育システムの開発
Project/Area Number |
16300260
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Research Institution | Tohoku University |
Principal Investigator |
伊藤 彰則 東北大学, 大学院・工学研究科, 助教授 (70232428)
|
Co-Investigator(Kenkyū-buntansha) |
牧野 正三 東北大学, 大学院・工学研究科, 教授 (00089806)
鈴木 基之 東北大学, 大学院・工学研究科, 助手 (30282015)
|
Keywords | CALLシステム / 音声認識 / 音素モデル / 話者適応 / MLLR法 / VFS法 / 外国語学習 / データベース |
Research Abstract |
まず、基礎データ収集として、「韓国人話者による日本語発声中の文法誤り」の収集を行った。20名の韓国人話者について、「日本人との日常会話」および「日常会話文の韓文和訳」をタスクとし、397の発話を収集した。これらの発話について、日本人話者による文法誤りのタグ付けを行った。また、日本人話者の英語発音にっいては、峯松らによる「日本人の英語データベース」に含まれる10名分の音声に対して、英語母語話者10名による発音誤りラベリングを行った。 次に、VFS法を用いてL2音声を話者適応する実験を行った。まず不特定話者による英語と日本語の音素モデルを学習し、次に日英バイリンガル話者の日本語音声を用いて英語・日本語両方の音素モデルの話者適応を行った。その結果、英語音響モデル・日本語音響モデルそれぞれの単独の認識性能は改善することがわかった。また、2つの音響モデルを組み合わせたバイリンガル音響モデルを作成し、バイリンガル話者の英語発音に適用したところ、話者適応なしの場合と比べて音素認識性能が改善した。 これと同じ実験を、今度は日本語母語話者について行った。すると、日本語音素モデルについては性能が改善するものの、バイリンガル音素モデルについては性能が低下することがわかった。その原因を調べたところ、正しい英語発音の音素を日本語音素と誤認識する傾向が見られた。 次に、MLLR法を用いて同じ実験を行った。その結果、VFS法を用いた場合よりは音素認識性能が向上するものの、性能向上の度合いはごく少ないことがわかった。 最後に、バイリンガル話者音声を用いたMLLR話者適応の実験を行った。この実験では、まず日英バイリンガル話者の音声を収集し、日本語と英語の不特定話者音素モデルをいったんこのバイリンガル話者に適応させる。その後、バイリンガル話者に適応された2つの音素モデルを、学習者の、日本語音声によって適応する。その結果、バイリンガル話者音声を使わずにMLLR適応した場合と比較して、音素認識率が約5%向上した。
|
Research Products
(4 results)