研究課題
本研究はユーザが英作文する過程において、部分的に適切な英語表現(単語、フレーズ、または節など)が思い浮かばないとき、本来言い表したい日本語表現をそのまま入力するだけで、すなわち、日英混在の入力文から状況に応じて動的に構成される文脈情報と、高品質で大規模な英語コーパスに加え超大規模なWebデータも統合的に利用することにより、適切な英語表現を自動生成する支援システムの研究開発を目指すものである。前年度ではフレーズレベルでの英作文支援の問題点を改善するために日英対訳パターンに基づくアプローチを考案し、そのために必要な大規模な日英対訳表現を日英対訳コーパスから抽出することを試みた。本年度では、まず、対訳表現抽出の改良を行い抽出数の向上と精度の大幅な向上に取り組んだ。そのためにまず、より多くの対訳表現が抽出できるように日英それぞれの単語n-gramの抽出方法に改良を加えた。次に,単語列の先頭に「いる」、「こと」、「みたい」などの不適切な単語がつく表現を、n-gram作成時に取り除けるように人手で作成した規則を導入した。さらに、抽出した対訳表現をできるだけ正しいものに絞り込めるように対訳辞書情報を適用した。実験の結果、計28万文対の日英対訳コーパスに対し、10万以上という大規模な対訳表現を0.96という高い精度で抽出することができた。本年度ではさらに、このように獲得した高精度で大規模な対訳表現を利用した日英対訳パターンに基づく英作文支援手法-すなわち、日本語シソーラスと形態素解析を適用し、用例ベース翻訳的な英作文支援手法を具体的に提案し、システムの実装を行った。実験の結果、提案手法の有効性を確認した。
すべて 2011 2010
すべて 雑誌論文 (3件) (うち査読あり 3件) 学会発表 (3件)
ICIC Express Letters, Part B : Applications
巻: vol.2, No.1 ページ: 113-118
Cognitive Computation
巻: Vol.2, No.4 ページ: 272-279
Themes in Science and Technology Education : Special Issue on ICT in Language Learning
巻: Vol.3, No.1&2 ページ: 223-238