2010 年度実績報告書

日英混在型入力による動的文脈照合英作文システムに関する研究

研究課題

研究課題/領域番号	19500133
研究機関	龍谷大学
研究代表者	馬青龍谷大学, 理工学部, 教授 (30358882)
研究分担者	吉見毅彦龍谷大学, 理工学部, 准教授 (50368031) 渡辺靖彦龍谷大学, 理工学部, 講師 (10288665)
キーワード	英作文支援 / 日英対訳コーパス / 日英対訳パターン / 日英対訳表現 / 用例ベース翻訳 / システムの実装 / 対訳辞書 / 日本語シソーラス
研究概要	本研究はユーザが英作文する過程において、部分的に適切な英語表現(単語、フレーズ、または節など)が思い浮かばないとき、本来言い表したい日本語表現をそのまま入力するだけで、すなわち、日英混在の入力文から状況に応じて動的に構成される文脈情報と、高品質で大規模な英語コーパスに加え超大規模なWebデータも統合的に利用することにより、適切な英語表現を自動生成する支援システムの研究開発を目指すものである。前年度ではフレーズレベルでの英作文支援の問題点を改善するために日英対訳パターンに基づくアプローチを考案し、そのために必要な大規模な日英対訳表現を日英対訳コーパスから抽出することを試みた。本年度では、まず、対訳表現抽出の改良を行い抽出数の向上と精度の大幅な向上に取り組んだ。そのためにまず、より多くの対訳表現が抽出できるように日英それぞれの単語n-gramの抽出方法に改良を加えた。次に,単語列の先頭に「いる」、「こと」、「みたい」などの不適切な単語がつく表現を、n-gram作成時に取り除けるように人手で作成した規則を導入した。さらに、抽出した対訳表現をできるだけ正しいものに絞り込めるように対訳辞書情報を適用した。実験の結果、計28万文対の日英対訳コーパスに対し、10万以上という大規模な対訳表現を0.96という高い精度で抽出することができた。本年度ではさらに、このように獲得した高精度で大規模な対訳表現を利用した日英対訳パターンに基づく英作文支援手法-すなわち、日本語シソーラスと形態素解析を適用し、用例ベース翻訳的な英作文支援手法を具体的に提案し、システムの実装を行った。実験の結果、提案手法の有効性を確認した。

研究成果
(6件)

すべて 2011 2010

すべて雑誌論文 (3件) (うち査読あり 3件) 学会発表 (3件)

[雑誌論文] Extraction of Parallel Translation Expressions for English-Writing Support Systems2011
- 著者名/発表者名
  馬、坂上、村田
- 雑誌名
  
  ICIC Express Letters, Part B : Applications
  
  巻: vol.2, No.1 ページ: 113-118
- 査読あり
[雑誌論文] Using the Maximum Entropy Method for Natural Language Processing : Category Estimation, Feature Extraction, and Error Correction2010
- 著者名/発表者名
  村田、馬(4番目), 他6名
- 雑誌名
  
  Cognitive Computation
  
  巻: Vol.2, No.4 ページ: 272-279
- 査読あり
[雑誌論文] Second Language Writing Classification System Based on Word Alignment Distribution2010
- 著者名/発表者名
  小谷、吉見
- 雑誌名
  
  Themes in Science and Technology Education : Special Issue on ICT in Language Learning
  
  巻: Vol.3, No.1&2 ページ: 223-238
- 査読あり
[学会発表] 辞書情報と規則を用いた大規模な日英対訳表現の抽出2011
- 著者名/発表者名
  坂上、馬、村田
- 学会等名
  言語処理学会第17回年次大会
- 発表場所
  豊橋技術科学大学
- 年月日
  2011-03-10
[学会発表] Classification of Language Learners' Sentences Into Native-Like or Non-Native-Hke Sentences Using Learner Sentences and Machine Translation Sentences as Learning Data2010
- 著者名/発表者名
  小谷、吉見
- 学会等名
  International Conference of Education, Research and Innovation(ICERI2010)
- 発表場所
  Madrid
- 年月日
  20101115-20101117
[学会発表] Do Neural Networks Have True Power for Natural Language Processing?2010
- 著者名/発表者名
  馬
- 学会等名
  Adv. in Neural Networks Research & Appli., Lecture Notes in Electrical Engineering(LNEE 67), Springer(ISNN2010)
- 発表場所
  Shanghai
- 年月日
  20100606-20100609

2010 年度 実績報告書

日英混在型入力による動的文脈照合英作文システムに関する研究

研究代表者

馬 青 龍谷大学, 理工学部, 教授 (30358882)

研究成果

[雑誌論文] Extraction of Parallel Translation Expressions for English-Writing Support Systems2011

著者名/発表者名

雑誌名

[雑誌論文] Using the Maximum Entropy Method for Natural Language Processing : Category Estimation, Feature Extraction, and Error Correction2010

著者名/発表者名

雑誌名

[雑誌論文] Second Language Writing Classification System Based on Word Alignment Distribution2010

著者名/発表者名

雑誌名

[学会発表] 辞書情報と規則を用いた大規模な日英対訳表現の抽出2011

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Classification of Language Learners' Sentences Into Native-Like or Non-Native-Hke Sentences Using Learner Sentences and Machine Translation Sentences as Learning Data2010

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Do Neural Networks Have True Power for Natural Language Processing?2010

著者名/発表者名

学会等名

発表場所

年月日

2010 年度実績報告書

馬青龍谷大学, 理工学部, 教授 (30358882)