• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2014 Fiscal Year Annual Research Report

多様なテキストへの高次アノテーションに基づく文脈理解モデルの明確化

Research Project

Project/Area Number 24300053
Research InstitutionKyoto University

Principal Investigator

黒橋 禎夫  京都大学, 情報学研究科, 教授 (50263108)

Co-Investigator(Kenkyū-buntansha) 河原 大輔  京都大学, 情報学研究科, 准教授 (10450694)
Project Period (FY) 2012-04-01 – 2015-03-31
Keywords自然言語処理 / 文脈理解 / 談話解析 / 照応解析 / コーパス
Outline of Annual Research Achievements

計算機による自然言語の形態素・構文解析は,コーパスに言語解釈を付与し,学習・評価を行うという方法論により90年代以降に急速に進展したが,文章の解析については,そのようなコーパス構築の複雑さ,コストの問題から進展せず,研究が停滞している状況にあった.本研究は文脈に関する高次アノテーションを多様で大規模なコーパスに対して行うことにより文脈理解モデルを明確化することを目的とする.具体的には,様々なウェブ文書の書き始め3文を収集したコーパスを構築し,これに対して照応関係と談話関係のアノテーションを行い,このアノテーション基準を明確化することにより計算機による文脈理解のゴールを明確化する.最終年度の平成26年度は次の成果を得た.
1. 5,000文書の省略・照応関係アノテーションの完成:多様なウェブページの先頭3文からなるコーパス,5,000文書に対して,形態素・構文情報と,著者・読者等の外界ゼロ照応を含む省略・照応情報に関するアノテーションを専門家によって行い,省略・照応関係コーパスを完成させた.
2. クラウドソーシングによる10,000文書の談話関係アノテーションの完成:重要な論理関係として根拠・条件と転換の2種類の談話関係に注目し,上述の5000文書を含む10,000文書(30,000文)に対して,談話関係の有無の判定とタイプの判定を2段階で行うクラウドソーシングにより談話関係アノテーションを行った.
3. クラウドソーシングによる確率的アノテーションを利用した談話関係解析:クラウドソーシングによる談話関係のアノテーションが10名によるものであり,各談話関係の確率が求められることから,この確率を機械学習で利用する方法を検討し,その利用で談話関係解析の精度が向上することを明らかにした.

Research Progress Status

26年度が最終年度であるため、記入しない。

Strategy for Future Research Activity

26年度が最終年度であるため、記入しない。

Causes of Carryover

26年度が最終年度であるため、記入しない。

Expenditure Plan for Carryover Budget

26年度が最終年度であるため、記入しない。

  • Research Products

    (7 results)

All 2015 2014 Other

All Journal Article (2 results) (of which Peer Reviewed: 2 results,  Open Access: 2 results) Presentation (3 results) Book (1 results) Remarks (1 results)

  • [Journal Article] 多様な文書の書き始めに対する意味関係タグ付きコーパスの構築とその分析2014

    • Author(s)
      萩行正嗣,河原大輔,黒橋禎夫
    • Journal Title

      自然言語処理

      Volume: 21 Pages: 213-248

    • Peer Reviewed / Open Access
  • [Journal Article] 外界照応および著者・読者表現を考慮した日本語ゼロ照応解析2014

    • Author(s)
      萩行正嗣, 河原大輔, 黒橋禎夫
    • Journal Title

      自然言語処理

      Volume: 21 Pages: 563-600

    • Peer Reviewed / Open Access
  • [Presentation] クラウドソーシングによる確率的アノテーションを利用した談話関係解析2015

    • Author(s)
      澤田晋之介, 小浜翔太郎, 河原大輔, 黒橋禎夫
    • Organizer
      情報処理学会 第77回全国大
    • Place of Presentation
      京都大学 (京都府京都市)
    • Year and Date
      2015-03-19
  • [Presentation] Rapid Development of a Corpus with Discourse Annotations using Two-stage Crowdsourcing2014

    • Author(s)
      Daisuke Kawahara, Yuichiro Machida, Tomohide Shibata, Sadao Kurohashi, Hayato Kobayashi and Manabu Sassano
    • Organizer
      25th International Conference on Computational Linguistics (COLING2014)
    • Place of Presentation
      Dublin, Ireland
    • Year and Date
      2014-08-15
  • [Presentation] 2段階のクラウドソーシングによる談話関係タグ付きコーパスの構築2014

    • Author(s)
      河原大輔, 町田雄一郎, 柴田知秀, 黒橋禎夫, 小林隼人, 颯々野学
    • Organizer
      情報処理学会 第217回自然言語処理研究会
    • Place of Presentation
      オホーツク・文化交流センター (北海道網走市)
    • Year and Date
      2014-07-04
  • [Book] 自然言語処理2015

    • Author(s)
      黒橋禎夫
    • Total Pages
      195
    • Publisher
      放送大学教育振興会
  • [Remarks] 京都大学ウェブ文書リードコーパス

    • URL

      http://nlp.ist.i.kyoto-u.ac.jp/index.php?KWDLC

URL: 

Published: 2016-06-01  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi