• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

文書集合からの事態関係知識の自動獲得と深い言語理解への応用

研究課題

研究課題/領域番号 15680006
研究種目

若手研究(A)

配分区分補助金
研究分野 知能情報学
研究機関奈良先端科学技術大学院大学

研究代表者

乾 健太郎  奈良先端科技大, 情報科学研究科, 助教授 (60272689)

研究期間 (年度) 2003 – 2005
研究課題ステータス 完了 (2004年度)
配分額 *注記
12,610千円 (直接経費: 9,700千円、間接経費: 2,910千円)
2004年度: 5,330千円 (直接経費: 4,100千円、間接経費: 1,230千円)
2003年度: 7,280千円 (直接経費: 5,600千円、間接経費: 1,680千円)
キーワード自然言語理解 / 因果関係知識 / 知識獲得 / 言語コーパス / 機械学習 / 接続標識
研究概要

本研究は,大規模な事態関係知識を文書集合から抽出し,深い言語理解の実現に利用する技術の確立を目的とするものである.計画立案当初は3年間で(a)事態間の因果関係に関する知識(以下,因果関係知識.Casuse(<地震が起こる>,<津波が起こる>),Effect(<X_<具体物>を干す>,<X_<具体物>が乾く>)など),および(b)事態の望ましさに関する単項関係知識(Positive(<健康である>),Negative(<津波が起こる>など)の2種類の知識を対象とする計画だったが,研究代表者が平成15年度2月より日本学術振興会在外研究のため渡英することになったので,(a)のタイプの因果関係知識の獲得に絞って研究を実施した.
まず,因果関係に立つ2つの出来事がそれぞれ行為であるか事態であるかに基づき,cause,effect,precond(ition),meansの4つの因果関係を定義した.接続標識「ため」を含む複文からこれら4つの因果関係への自動分類実験を行い,cause,precond,meansの各関係について,80%の再現率で95%以上の分類精度を達成した.また,effect関係については,30%の再現率で90%の分類精度,を達成した.さらに,新聞記事1年分の文書集合に本手法を適用することにより,およそ27,000件を超える因果知識が獲得できる見積りを得た.
研究費は主として,上記の実験を行うための言語データ(因果関係タグ付きコーパス)や関連する辞書,言語資源の開発に利用した.得られた資源は,研究成果の一部として順次Web上で公開し,本研究領域の今後の発展に資するものとする予定である.

報告書

(1件)
  • 2003 実績報告書
  • 研究成果

    (3件)

すべて その他

すべて 文献書誌 (3件)

  • [文献書誌] 乾孝司, 乾健太郎, 松本裕治: "接続標識「ため」に基づく文書集合からの因果関係知識の自動獲得"情報処理学会論文誌. 45・3. 919-433 (2004)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 藤田篤, 乾健太郎, 松本裕治: "自動生成された言い換え文における不適格な動詞格構造の検出"情報処理学会論文誌. 45・4(印刷中). (2004)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] N.Kobayashi, K.Inui, Y.Matsumoto, K.Tateishi, T.Fukushima: "Collecting Evaluative Expressions for Opinion Extraction"Proceedings of the 1st International Joint Conference on Natural Language Processing (IJCNLP-04). 584-589 (2004)

    • 関連する報告書
      2003 実績報告書

URL: 

公開日: 2003-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi