2010 Fiscal Year Annual Research Report
日英混在型入力による動的文脈照合英作文システムに関する研究
Project/Area Number |
19500133
|
Research Institution | Ryukoku University |
Principal Investigator |
馬 青 龍谷大学, 理工学部, 教授 (30358882)
|
Co-Investigator(Kenkyū-buntansha) |
吉見 毅彦 龍谷大学, 理工学部, 准教授 (50368031)
渡辺 靖彦 龍谷大学, 理工学部, 講師 (10288665)
|
Keywords | 英作文支援 / 日英対訳コーパス / 日英対訳パターン / 日英対訳表現 / 用例ベース翻訳 / システムの実装 / 対訳辞書 / 日本語シソーラス |
Research Abstract |
本研究はユーザが英作文する過程において、部分的に適切な英語表現(単語、フレーズ、または節など)が思い浮かばないとき、本来言い表したい日本語表現をそのまま入力するだけで、すなわち、日英混在の入力文から状況に応じて動的に構成される文脈情報と、高品質で大規模な英語コーパスに加え超大規模なWebデータも統合的に利用することにより、適切な英語表現を自動生成する支援システムの研究開発を目指すものである。 前年度ではフレーズレベルでの英作文支援の問題点を改善するために日英対訳パターンに基づくアプローチを考案し、そのために必要な大規模な日英対訳表現を日英対訳コーパスから抽出することを試みた。本年度では、まず、対訳表現抽出の改良を行い抽出数の向上と精度の大幅な向上に取り組んだ。そのためにまず、より多くの対訳表現が抽出できるように日英それぞれの単語n-gramの抽出方法に改良を加えた。次に,単語列の先頭に「いる」、「こと」、「みたい」などの不適切な単語がつく表現を、n-gram作成時に取り除けるように人手で作成した規則を導入した。さらに、抽出した対訳表現をできるだけ正しいものに絞り込めるように対訳辞書情報を適用した。実験の結果、計28万文対の日英対訳コーパスに対し、10万以上という大規模な対訳表現を0.96という高い精度で抽出することができた。本年度ではさらに、このように獲得した高精度で大規模な対訳表現を利用した日英対訳パターンに基づく英作文支援手法-すなわち、日本語シソーラスと形態素解析を適用し、用例ベース翻訳的な英作文支援手法を具体的に提案し、システムの実装を行った。実験の結果、提案手法の有効性を確認した。
|
Research Products
(6 results)