• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2011 Fiscal Year Annual Research Report

大規模テキストから自動獲得した知識に基づく言語解析の精度向上

Research Project

Project/Area Number 21700163
Research InstitutionKyoto University

Principal Investigator

柴田 知秀  京都大学, 情報学研究科, 助教 (70452315)

Keywords自然言語処理 / 大規模テキスト / 知識獲得 / 同義語 / 分布類似度
Research Abstract

1.述語項構造の共起関係と格フレームを用いた事態間関係の自動獲得
「X{人}がY{財布}を拾う=>X{人}がY{財布}をZ{警察}に届ける」のようなよく共起する2つの事態(イベント)を大規模テキストから自動獲得した。まず、大規模テキストから係り受け関係にある述語項構造ペアを抽出し、Aprioriアルゴリズムにより述語項構造の共起度を効率よく計算した。次に、共起度が高い述語項構造に対して、格フレームを用いることにより、項の対応付けをとった。大規模テキストから約2万個の事態ペアを獲得することができた。
2.Wikipediaからの大規模語彙の自動獲得
Wikipediaの記事から語を獲得し、また、語の上位語、同義語などの情報も合わせて獲得した。獲得した語彙は形態素解析器JUMANと構文解析器KNPの辞書として利用し、実テキストを頑健に解析できるようにした。
B.述語項構造に基づくテキスト含意認識
テキストと仮説を述語項構造単位で扱い、テキストと仮説間のマッチングをとる含意関係認識システムを構築し、MTCIR-9のRITEタスクに参加した。テキスト・仮説の構文構造を解析し、述語項構造の集合として表現し、また、テキスト・仮説問のマッチングには国語辞典やWikipedia、Webコーパスから得られた語句の同義や上位下位関係を利用した。BC(二値分類)、MC(多値分類)、EXAM(大学入試タスク)、RITE4QA(質問応答タスク)に参加し、それぞ0.55,0.48,0.66,0.89の精度を達成した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

語句や事態間関係などの大規模知識の獲得については順調に進展している。解析器の精度向上に関しては今年度の課題となる。

Strategy for Future Research Activity

大規模知識の獲得を進めるとともに、言語解析器の精度向上を重点的に今年度進める予定である。

  • Research Products

    (5 results)

All 2012 2011

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (4 results)

  • [Journal Article] TSUBAKI : An Open Search Engine Infrastructure for Developing Information Access Methodology2011

    • Author(s)
      Keiji Shinzato, Tomohide Shibata, Daisuke Kawahara, Sadao Kurohashi
    • Journal Title

      Journal of Information Processing

      Volume: 52

    • Peer Reviewed
  • [Presentation] 実テキスト解析をささえる語彙知識の自動獲得2012

    • Author(s)
      柴田知秀, 村脇有吾, 黒橋禎夫, 河原大輔
    • Organizer
      言語処理学会第18回年次大会
    • Place of Presentation
      広島
    • Year and Date
      2012-03-14
  • [Presentation] Predicate-argument Structure based Textual Entailment Recognition System of KYOTO Team for NTCIR9 RITE2011

    • Author(s)
      Tomohide Shibata, Sadao Kurohashi
    • Organizer
      the 9th NTCIR Workshop Meeting on Evaluation of Information Access Technologies (NTCIR-9)
    • Place of Presentation
      Tokyo
    • Year and Date
      2011-12-08
  • [Presentation] Acquiring Strongly-related Events using Predicate-argument Co-occurring Statistics and Case Frames2011

    • Author(s)
      Tomohide Shibata, Sadao Kurohashi
    • Organizer
      the 5th International Joint Conference on Natural Language Processing (IJCNLP2011)
    • Place of Presentation
      Chiang Mai, Thailand
    • Year and Date
      2011-11-09
  • [Presentation] 述語項構造の共起情報と格フレームを用いた事態間知識の自動獲得2011

    • Author(s)
      柴田知秀, 黒橋禎夫
    • Organizer
      情報処理学会自然言語処理研究会
    • Place of Presentation
      徳島
    • Year and Date
      2011-09-16

URL: 

Published: 2013-06-26  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi