• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2012 Fiscal Year Research-status Report

グラフ理論に基づく自然言語解析の定式化

Research Project

Project/Area Number 23500177
Research InstitutionKyoto University

Principal Investigator

森 信介  京都大学, 学術情報メディアセンター, 准教授 (90456773)

Keywords言語処理
Research Abstract

国立国語研究所の『現代日本語書き言葉均衡コーパス』のコアデータの1/10に対して単語係り受け情報を付与し、前年度の成果である最大全域木に基づく係り受け解析器の様々な分野に対する解析精度向上を実現した。また、研究・開発を通して係り受け解析器を特許文書、レシピ、ブログ等に分野適応し、それぞれの分野と全体での精度向上を確認した。述語項構造解析や固有表現抽出を実装し、レシピを題材として、テキストを1つのフローグラフにする手法を確立した。
本研究の成果である係り受け解析器とそのモデルを以下のサイトで公開し始めた。
係り受け解析器 EDA: http://www.ar.media.kyoto-u.ac.jp/members/flannery/eda/

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

最大全域木に基づく係り受け解析器を様々な分野に適応し、解析精度の向上を確認した。また、本研究で提案するテキスト処理を評価するためのタグ付きデータをレシピテキストの分野において作成した。これにより、グラフ理論に基づく全体最適化としてのテキスト処理を実装・実験する準備が整いつつあるといえる。

Strategy for Future Research Activity

まず、今年度に作成したタグ付きデータの基準に沿って、単語分割から述語項構造解析までの様々な言語処理の段階の部分的アノテーションコーパスを作成し、対象とする分野における言語処理の精度を十分に高める。
これらの組み合わせをベースラインとし、本研究計画で提案するグラフ理論に基づく全体最適化としてのテキスト処理の結果を評価する。この際、すでに一部準備したフローグラフ化したレシピテキストを用いる。

Expenditure Plans for the Next FY Research Funding

主に、以下の目的に研究費を使用する。
1) 言語処理の各段階の部分的アノテーションコーパスの作成
2) 評価用のレシピテキストとそのフローグラフの作成
3) 全体最適化等の実装を含めた実験補助者の雇用
4) 研究発表のための出張や論文の別刷り代

  • Research Products

    (8 results)

All 2013 2012 Other

All Journal Article (2 results) (of which Peer Reviewed: 2 results) Presentation (5 results) Remarks (1 results)

  • [Journal Article] 自然言語処理における分野適応2012

    • Author(s)
      森 信介
    • Journal Title

      人工知能学会誌

      Volume: Vol.27,No.4 Pages: 365-372

    • URL

      http://plata.ar.media.kyoto-u.ac.jp/mori/research/public/

    • Peer Reviewed
  • [Journal Article] A Pointwise Approach to Training Dependency Parsers from Partially Annotated Corpora2012

    • Author(s)
      Daniel Flannery, Yusuke Miyao, Graham Neubig, Shinsuke Mori
    • Journal Title

      Natural Language Processing

      Volume: 19(3) Pages: 167-191

    • DOI

      NAID:40019452670

    • Peer Reviewed
  • [Presentation] Combining Active Learning and Partial Annotation for Japanese Dependency Parsing2013

    • Author(s)
      Daniel Flannery, Yusuke Miyao, Shinsuke Mori, Tatsuya Kawahara
    • Organizer
      言語処理学会第19回年次大会
    • Place of Presentation
      名古屋, 名古屋大学
    • Year and Date
      20130313-20130315
  • [Presentation] 『現代日本語書き言葉均衡コーパス』に対する係り受け付与2013

    • Author(s)
      森 信介, 小椋 秀樹
    • Organizer
      言語処理学会第19回年次大会
    • Place of Presentation
      名古屋, 名古屋大学
    • Year and Date
      20130313-20130315
  • [Presentation] レシピテキストと調理映像からの実世界理解に向けて2012

    • Author(s)
      森 信介, 舩冨 卓哉
    • Organizer
      テキストアノテーションワークショップ・コンテスト
    • Place of Presentation
      東京, 国立情報学研究所
    • Year and Date
      20120806-20120807
  • [Presentation] 素性頻度ファイルと部分的アノテーションコーパスからの単語分割器の学習2012

    • Author(s)
      笹田 鉄郎, 森 信介, Graham NEUBIG, 河原 達也
    • Organizer
      情報処理学会研究報告, NL207
    • Place of Presentation
      札幌, 北海道大学
    • Year and Date
      20120726-20120727
  • [Presentation] A Machine Learning Approach to Recipe Text Processing2012

    • Author(s)
      Shinsuke Mori, Tetsuro Sasada, Yoko Yamakata, Koichiro Yoshino
    • Organizer
      Cooking with Computers Workshop
    • URL

      http://plata.ar.media.kyoto-u.ac.jp/mori/research/public/

    • Year and Date
      20120000
  • [Remarks] EDA Dependency Parser

    • URL

      http://plata.ar.media.kyoto-u.ac.jp/tool/EDA/home_en.html

URL: 

Published: 2014-07-24  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi