• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2010 Fiscal Year Annual Research Report

日英混在型入力による動的文脈照合英作文システムに関する研究

Research Project

Project/Area Number 19500133
Research InstitutionRyukoku University

Principal Investigator

馬 青  龍谷大学, 理工学部, 教授 (30358882)

Co-Investigator(Kenkyū-buntansha) 吉見 毅彦  龍谷大学, 理工学部, 准教授 (50368031)
渡辺 靖彦  龍谷大学, 理工学部, 講師 (10288665)
Keywords英作文支援 / 日英対訳コーパス / 日英対訳パターン / 日英対訳表現 / 用例ベース翻訳 / システムの実装 / 対訳辞書 / 日本語シソーラス
Research Abstract

本研究はユーザが英作文する過程において、部分的に適切な英語表現(単語、フレーズ、または節など)が思い浮かばないとき、本来言い表したい日本語表現をそのまま入力するだけで、すなわち、日英混在の入力文から状況に応じて動的に構成される文脈情報と、高品質で大規模な英語コーパスに加え超大規模なWebデータも統合的に利用することにより、適切な英語表現を自動生成する支援システムの研究開発を目指すものである。
前年度ではフレーズレベルでの英作文支援の問題点を改善するために日英対訳パターンに基づくアプローチを考案し、そのために必要な大規模な日英対訳表現を日英対訳コーパスから抽出することを試みた。本年度では、まず、対訳表現抽出の改良を行い抽出数の向上と精度の大幅な向上に取り組んだ。そのためにまず、より多くの対訳表現が抽出できるように日英それぞれの単語n-gramの抽出方法に改良を加えた。次に,単語列の先頭に「いる」、「こと」、「みたい」などの不適切な単語がつく表現を、n-gram作成時に取り除けるように人手で作成した規則を導入した。さらに、抽出した対訳表現をできるだけ正しいものに絞り込めるように対訳辞書情報を適用した。実験の結果、計28万文対の日英対訳コーパスに対し、10万以上という大規模な対訳表現を0.96という高い精度で抽出することができた。本年度ではさらに、このように獲得した高精度で大規模な対訳表現を利用した日英対訳パターンに基づく英作文支援手法-すなわち、日本語シソーラスと形態素解析を適用し、用例ベース翻訳的な英作文支援手法を具体的に提案し、システムの実装を行った。実験の結果、提案手法の有効性を確認した。

  • Research Products

    (6 results)

All 2011 2010

All Journal Article (3 results) (of which Peer Reviewed: 3 results) Presentation (3 results)

  • [Journal Article] Extraction of Parallel Translation Expressions for English-Writing Support Systems2011

    • Author(s)
      馬、坂上、村田
    • Journal Title

      ICIC Express Letters, Part B : Applications

      Volume: vol.2, No.1 Pages: 113-118

    • Peer Reviewed
  • [Journal Article] Using the Maximum Entropy Method for Natural Language Processing : Category Estimation, Feature Extraction, and Error Correction2010

    • Author(s)
      村田、馬(4番目), 他6名
    • Journal Title

      Cognitive Computation

      Volume: Vol.2, No.4 Pages: 272-279

    • Peer Reviewed
  • [Journal Article] Second Language Writing Classification System Based on Word Alignment Distribution2010

    • Author(s)
      小谷、吉見
    • Journal Title

      Themes in Science and Technology Education : Special Issue on ICT in Language Learning

      Volume: Vol.3, No.1&2 Pages: 223-238

    • Peer Reviewed
  • [Presentation] 辞書情報と規則を用いた大規模な日英対訳表現の抽出2011

    • Author(s)
      坂上、馬、村田
    • Organizer
      言語処理学会第17回年次大会
    • Place of Presentation
      豊橋技術科学大学
    • Year and Date
      2011-03-10
  • [Presentation] Classification of Language Learners' Sentences Into Native-Like or Non-Native-Hke Sentences Using Learner Sentences and Machine Translation Sentences as Learning Data2010

    • Author(s)
      小谷、吉見
    • Organizer
      International Conference of Education, Research and Innovation(ICERI2010)
    • Place of Presentation
      Madrid
    • Year and Date
      20101115-20101117
  • [Presentation] Do Neural Networks Have True Power for Natural Language Processing?2010

    • Author(s)
      馬
    • Organizer
      Adv. in Neural Networks Research & Appli., Lecture Notes in Electrical Engineering(LNEE 67), Springer(ISNN2010)
    • Place of Presentation
      Shanghai
    • Year and Date
      20100606-20100609

URL: 

Published: 2012-07-19  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi