• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2010 Fiscal Year Annual Research Report

教材の自動評価のための学校文法に基づいた安全な英文解析システムの開発

Research Project

Project/Area Number 21720211
Research InstitutionRitsumeikan University

Principal Investigator

田中 省作  立命館大学, 文学部, 准教授 (00325549)

Keywords学校文法 / 構文解析 / 機械学習 / コーパス
Research Abstract

今年度は,主に次のような2点に軸を置き,研究を推進した.
1.再現率を優先した文法項目の検出ルールの整備
代表者が分担者としてかかわっているプロジェクトで構築を進めている,学校文法に関する情報を付与したコーパスを学習データとして,機械学習などを活用すれば(やや過学習の傾向もあり)適合率が高い文法項目の検出ルールが比較的容易に整備される.しかしその一方で,再現率が必ずしも高くないため,応用研究に適用した場合には,非常に出現率が低いものの特徴的で重要な文法項目を取りもらす傾向がある.応用研究によっては(たとえば,質情報が付与された科学論文データを質的観点で比較し,その要因を探る等),そのように滅多には出ないが,重要となる文法項目が存在する場合も少なくない.そこで,今年度は再現率に重きをおいた検出ルールの整備を進めた.検出ルールを人手で書くのが難しい文法項目については,浅く構文解析した結果(チャンキング情報)に,各文法項目に重要となるような単語以外は品詞でマスクし,決定株を弱学習器としたブースティングで判別器を構成した.もし再現率が不十分な場合は判別器に表れる素性等を参照しつつ,検出ルールをさらに人手で書き加えた.文脈を頼りにする文法項目(たとえば条件節がない帰結節のみの文など)については,明確に検出し分けることが極めて難しいため,再現率を優先することで,適合率をかなり落とすようなルールも散見され,今後の課題である.
2.学校文法に基づいた英文解析システムの開発と公開準備
昨年度と今年度に記述した学校文法項目の検出ルールを組み合わせた解析システムを実装し,Web上での公開を進めた(本報告書を記述している2011年3月は本研究室の計算機環境の更新等もあり,まだ正式版は公開できていない).

  • Research Products

    (8 results)

All 2011 2010 Other

All Journal Article (4 results) (of which Peer Reviewed: 4 results) Presentation (3 results) Remarks (1 results)

  • [Journal Article] Webを源とした質情報付き英語科学論文コーパスの構築法2011

    • Author(s)
      田中省作, 柴田雅博, 冨浦洋一
    • Journal Title

      英語コーパス研究

      Volume: 18 Pages: 61-72

    • Peer Reviewed
  • [Journal Article] Webコーパスの言語情報処理基盤2011

    • Author(s)
      田中省作
    • Journal Title

      英語コーパス研究

      Volume: 18 Pages: 97-112

    • Peer Reviewed
  • [Journal Article] 英文法コーパス構築の有用性2011

    • Author(s)
      徳見道夫, 田中省作
    • Journal Title

      言語科学

      Volume: 46 Pages: 61-74

    • Peer Reviewed
  • [Journal Article] Development of Web Application to Help Write Technical Documents in English : Using Corpus for Language Teaching2010

    • Author(s)
      Miyazaki, Y., Ikemoto, T., Tanaka, S.
    • Journal Title

      Proceedings of the ICTATLL 2010 Kyoto Conference

      Pages: 149-158

    • Peer Reviewed
  • [Presentation] 意味や使用域が緩やかに類似した文集合の表層的汎化-可能性と課題-2011

    • Author(s)
      田中省作
    • Organizer
      言語研究と統計2011
    • Place of Presentation
      統計数理研究所(東京都)
    • Year and Date
      2011-03-14
  • [Presentation] 英作文支援のためのクラスn-gramモデルに基づいた文例の汎化2011

    • Author(s)
      田中省作, 宮崎佳典, 池本孝徳, 小山由紀江
    • Organizer
      応用数理学会環瀬戸内応用数理研究部会第14回シンポジウム
    • Place of Presentation
      岡山理科大学(岡山県)
    • Year and Date
      2011-01-23
  • [Presentation] 質問紙分析法2010

    • Author(s)
      田中省作
    • Organizer
      MHB研究会リサーチメソッド学習会
    • Place of Presentation
      立命館大学(京都府)
    • Year and Date
      2010-11-07
  • [Remarks]

    • URL

      http://www.cl.ritsumei.ac.jp/SGA/trial/

URL: 

Published: 2012-07-19  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi