• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2013 Fiscal Year Annual Research Report

多様なテキストへの高次アノテーションに基づく文脈理解モデルの明確化

Research Project

Project/Area Number 24300053
Research InstitutionKyoto University

Principal Investigator

黒橋 禎夫  京都大学, 情報学研究科, 教授 (50263108)

Co-Investigator(Kenkyū-buntansha) 河原 大輔  京都大学, 情報学研究科, 准教授 (10450694)
柴田 知秀  京都大学, 情報学研究科, 助教 (70452315)
Project Period (FY) 2012-04-01 – 2015-03-31
Keywords自然言語処理 / 文脈理解 / 談話解析 / 照応解析 / コーパス
Research Abstract

計算機による自然言語の形態素・構文解析は,コーパスに言語解釈を付与し,学習・評価を行うという方法論により90年代以降に急速に進展したが,文章の解析については,そのようなコーパス構築の複雑さ,コストの問題から進展せず,研究が停滞している状況にあった.本研究は文脈に関する高次アノテーションを多様で大規模なコーパスに対して行うことにより文脈理解モデルを明確化することを目的とする.具体的には,種々の文章の書き始め3文,5000文書のコーパスに対して照応関係と談話関係のアノテーションを行い,このアノテーション基準を明確化することにより計算機による文脈理解のゴールを明確化する.平成25年度は次の成果を得た.
1. 3,000文書の省略・照応関係アノテーションと省略・照応解析システムの学習:平成24年度に収集した多様なウェブページの先頭3文からなるコーパス,3,000文書に対して,形態素・構文情報と,外界ゼロ照応を含む省略・照応情報のアノテーションを行った.また,この情報に基づき,ランキングSVMを用いた省略・照応解析システムを構築した.
2. 著者・読者のアノテーション基準の明確化:人手によるアノテーションと,省略・照応自動解析結果を比較することにより,アノテーションの検討を行った.その結果,文脈に出現しない著者,読者,さらに不特定人に対するアノテーションの一貫性が十分でないことが明らかになったため,基準の明確化とアノテーションの見直しを行った.
3. 談話関係アノテーション基準の設定とクラウドソーシングによる5,000文書のアノテーション:談話関係について,重要な論理関係として根拠・条件と転換の2種類に注目してアノテーションを行うことを決定し,その基準を明確化した.さらに,ウェブ5,000文書(15,000文)に対して,クラウドソーシングを用いることにより談話関係アノテーションを実施した.

Current Status of Research Progress
Current Status of Research Progress

1: Research has progressed more than it was originally planned.

Reason

省略・照応関係については3,000文書(9,000文)のアノテーションと,自動解析結果とアノテーションの比較による基準見直しを行い,目標5,000文書に対して順調に進展している.また,談話関係については,クラウドソーシングの利用によりすでに目標の5,000文書のアノテーションを終了した.

Strategy for Future Research Activity

2,000文書の省略・照応関係アノテーションの実施,省略・照応関係と談話関係の相互作用に関する分析,さらに,自動解析システムとの比較による注釈の一貫性の確認と,コーパスの公開を行う.照応関係アノテーションのデータ作成費,調査旅費,成果発表旅費,計算機関係消耗品等に補助金および助成金を使用する.

  • Research Products

    (3 results)

All 2014 2013

All Journal Article (1 results) (of which Peer Reviewed: 1 results,  Open Access: 1 results) Presentation (2 results)

  • [Journal Article] 多様な文書の書き始めに対する意味関係タグ付きコーパスの構築とその分析2014

    • Author(s)
      萩行正嗣,河原大輔,黒橋禎夫
    • Journal Title

      自然言語処理

      Volume: 21 Pages: 213-248

    • Peer Reviewed / Open Access
  • [Presentation] 著者・読者表現および外界ゼロ照応を考慮したゼロ照応解析2014

    • Author(s)
      萩行正嗣, 河原大輔, 黒橋禎夫
    • Organizer
      言語処理学会 第20回年次大会
    • Place of Presentation
      札幌
    • Year and Date
      20140318-20140320
  • [Presentation] Japanese Zero Reference Resolution Considering Exophora and Author/Reader Mentions2013

    • Author(s)
      Masatsugu Hangyo, Daisuke Kawahara and Sadao Kurohashi
    • Organizer
      EMNLP 2013: Conference on Empirical Methods in Natural Language Processing
    • Place of Presentation
      Seattle, USA
    • Year and Date
      20131019-20131021

URL: 

Published: 2015-05-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi