• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

規則と確率モデルの融合に基づく情報抽出技法に関する研究

研究課題

研究課題/領域番号 17700140
研究種目

若手研究(B)

配分区分補助金
研究分野 知能情報学
研究機関東京工業大学

研究代表者

亀谷 由隆  東京工業大学, 大学院情報理工学研究科, 助手 (60361789)

研究期間 (年度) 2005 – 2006
研究課題ステータス 完了 (2006年度)
配分額 *注記
2,100千円 (直接経費: 2,100千円)
2006年度: 1,000千円 (直接経費: 1,000千円)
2005年度: 1,100千円 (直接経費: 1,100千円)
キーワード情報抽出 / 確率モデル / 規則学習
研究概要

近年,Webの発展などにより豊富な情報を収集することが可能になった一方で,それらを人間の知識として活用する知識処理技術の重要性が改めて認識されている.人間の知識の多くは平文テキスト,あるいはHTMLやXMLといった半構造テキストで記述されており,そのようなテキストから予め指定された必要な情報を抜き出す技術を情報抽出技術と呼ぶ.情報抽出をオントロジーや知識ベースの(半)自動合成のための基礎技術と捉えることができる.サブタスクである固有表現抽出を含めると,情報抽出には規則学習に基づくアプローチ,確率モデルに基づくアプローチなどがあるが,本研究では規則学習に基づくアプローチと確率モデルに基づくアプローチ両者の融合を行う情報抽出システムの構築を目指した.
本研究ではまず,そのようなシステムの基盤として論理式に基づく規則表現を許し,統計的学習ルーチンを備えた確率論理プログラミング言語処理系であるPRISM (programming in statistical modeling)を整備した.標準的ベンチマークセットであるカーネギーメロン大学のセミナー案内データ(CMU seminar)は単語数3,000を越える文章も含むが,この整備により比較的入手が容易な計算機での大量な処理も可能になった.一方,頻出パターン抽出技法を利用した,規則に基づく情報抽出器として知られる(LP)^2をJava言語で実装し,(LP)^2によって得られた規則を内包した確率モデルをPRISMで記述した.しかし,CRF (conditional random field)やサポートベクターマシンなどの情報抽出研究で行われている最新のベンチマーク結果に比較すると抽出精度は劣っており,現在の確率モデルのベースである動的ベイジアンネットワーク(dynamic Bayesian network)からCRFへ移行するなどの必要性があると考えられる.

報告書

(2件)
  • 2006 実績報告書
  • 2005 実績報告書
  • 研究成果

    (6件)

すべて 2007 2006 2005

すべて 雑誌論文 (6件)

  • [雑誌論文] Discovering Concepts from Word Co-occurrences with a Relational Model2007

    • 著者名/発表者名
      Kurihara, K., Kameya, Y., Sato, T.
    • 雑誌名

      Transactions of the Japanese Society for Artificial Intelligence 22・2

      ページ: 218-226

    • NAID

      130000058333

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] 頻出部分木発見手法を用いた遺伝的プログラミングの交通信号制御問題への適用2007

    • 著者名/発表者名
      熊谷潤一, 小島康夫, 高重聡一, 亀谷由隆, 佐藤泰介
    • 雑誌名

      人工知能学会論文誌 22・2

      ページ: 127-139

    • NAID

      10022007221

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] Parallel EM Learning for Symbolic-Statistical Models2006

    • 著者名/発表者名
      Izumi, Y., Kameya, Y., Sato, T.
    • 雑誌名

      Proceedings of the International Workshop on Data-Mining and Statistical Science

      ページ: 133-140

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] Learning through failure2006

    • 著者名/発表者名
      Sato, T., Kameya, Y
    • 雑誌名

      Dagstuhl Seminar Proceedings on Probabilistic, Logical and Relational Learning - Towards a Synthesis (web掲載)

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] Negation elimination for finite PCFGs2005

    • 著者名/発表者名
      Sato, T., Kameya, Y
    • 雑誌名

      Logic-based Program Synthesis and Transformation

      ページ: 117-132

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] Generative modeling with failure in PRISM2005

    • 著者名/発表者名
      Sato, T., Kameya, Y., Zhou, N.-F.
    • 雑誌名

      Proceedings of the 19th International Joint Conference on Artificial Intelligence

      ページ: 847-852

    • 関連する報告書
      2005 実績報告書

URL: 

公開日: 2005-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi