2009 Fiscal Year Annual Research Report
日本語母語話者の英語学習のための韻律評価および文法誤り検出の高度化
Project/Area Number |
20320075
|
Research Institution | Tohoku University |
Principal Investigator |
伊藤 彰則 Tohoku University, 大学院・工学研究科, 准教授 (70232428)
|
Keywords | 外国語学習システム / 英語学習システム / 発音評価 / イントネーション / 重回帰分析 / 文法誤り検出 / 文法誤りルール / N-gram |
Research Abstract |
今年度は、日本人英語イントネーション評価の高精度化と、文法誤り検出に関する基礎検討を行った。 日本人英語イントネーション評価を行うためには、学習者による英語文の発話と、複数の英語母語話者(教師話者)による同じ文の発話のイントネーションを比較する必要がある。この際に、イントネーションを直接表す特徴量と、文のリズムを表す特徴量をそれぞれ計算するが、従来はひとつの学習者発話についてそれらのスコアを独立に計算してから重み付きで足し合わせることで最終的なスコアを計算していた。これに対し本研究では、2つのスコアを教師話者ごとに最適に組み合わせ、さらにそれを重回帰分析によって統合するという方法を開発した。提案法により、人間による評定平均値とシステムの評価値の相関は最大0.54となった。英語母語話者による評定値の評定者間相関が最大0.55であることを考えると、提案法によって英語母語話者による評価と同等のイントネーション評価が実現できたと言える。 次に、日本人が話した英文に含まれる文法誤りを自動検出する手法の改良について検討した。この方法は、以前我々が開発した方法と同じく、文法誤りルールによる誤り文生成と、生成した誤り文からのn-gram学習に基づく認識方法である。以前の研究では、一つの単語に対して文脈に関係なく誤りルールを適用していた。これに対して、我々は単語の置かれた文脈まで考慮した誤りルールを作成し、実際に適用した。また、以前の研究ではきちんと取り扱われていなかった短縮形(I'm等)をルールに組み込み、短縮形と非短縮形どちらも同様に生成できるようルールを構成した。誤りルールを改良した結果、単語認識率は88.3%から89.2%に改善した。
|