2009 Fiscal Year Annual Research Report
日英混在型入力による動的文脈照合英作文システムに関する研究
Project/Area Number |
19500133
|
Research Institution | Ryukoku University |
Principal Investigator |
馬 青 Ryukoku University, 理工学部, 教授 (30358882)
|
Co-Investigator(Kenkyū-buntansha) |
吉見 毅彦 龍谷大学, 理工学部, 准教授 (50368031)
渡辺 靖彦 龍谷大学, 理工学部, 講師 (10288665)
|
Keywords | 英作文支援 / 日英混在文 / 日英対訳パターン / 日英対訳表現 / 日英対訳コーパス / 抽出 |
Research Abstract |
本研究はユーザが英作文する過程において、部分的に適切な英語表現(単語、フレーズ、または節など)が思い浮かばないとき、本来言い表したい日本語表現をそのまま入力するだけで、すなわち、日英混在の入力文から状況に応じて動的に構成される文脈情報と、高品質で大規模な英語コーパスに加え超大規模なWebデータも統合的に利用することにより、適切な英語表現を自動生成する支援システムの研究開発を目指すものである。21年度では、研究実施計画に沿って研究調査を進め、主に以下のような成果が得られた。 (1)本研究に関連する要素技術として、引き続き機械翻訳システムの性能評価研究の一環として逐語訳に着目した外国語学習者作文の自動評価に関する研究と単語アライメントを用いた英日機械翻訳文の流暢さの自動評価に関する研究を行い、英作文支援システムの性能評価に役立つ評価手法を提案した。 (2)前年度では、英作文支援を単語レベルから名詞句と動詞句のフレーズレベルへ拡張した。しかし、英語フレーズは訳語候補の組み合わせのみから生成されるため、支援できるフレーズの範囲が大きく限定されてしまう。また、名詞句などを不定詞句に英訳するような、異なるパターンへの英訳も支援できない。さらに、単語の訳語候補の数が多いためその組み合わせの数が膨大となり処理時間がかかってしまう。このような問題を解決する方法の1つとして、日英対訳パターンに基づくアプローチ、すなわち、日英対訳パターン辞書を構築し,その辞書を介在して英作文支援を行う手法が考えられる。本年度では、このようなパターン辞書を作成するにあたり必要となる大規模な日英対訳表現を大規模な日英対訳コーパスから抽出することを試みた。実験の結果、数十万文の大規模な日英対訳コーパスに対し、数十万の単語n-gramまたは文節n-gramの対訳表現を良好な精度で抽出することができた。
|