• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2006 Fiscal Year Annual Research Report

規則と確率モデルの融合に基づく情報抽出技法に関する研究

Research Project

Project/Area Number 17700140
Research InstitutionTokyo Institute of Technology

Principal Investigator

亀谷 由隆  東京工業大学, 大学院情報理工学研究科, 助手 (60361789)

Keywords情報抽出 / 確率モデル / 規則学習
Research Abstract

近年,Webの発展などにより豊富な情報を収集することが可能になった一方で,それらを人間の知識として活用する知識処理技術の重要性が改めて認識されている.人間の知識の多くは平文テキスト,あるいはHTMLやXMLといった半構造テキストで記述されており,そのようなテキストから予め指定された必要な情報を抜き出す技術を情報抽出技術と呼ぶ.情報抽出をオントロジーや知識ベースの(半)自動合成のための基礎技術と捉えることができる.サブタスクである固有表現抽出を含めると,情報抽出には規則学習に基づくアプローチ,確率モデルに基づくアプローチなどがあるが,本研究では規則学習に基づくアプローチと確率モデルに基づくアプローチ両者の融合を行う情報抽出システムの構築を目指した.
本研究ではまず,そのようなシステムの基盤として論理式に基づく規則表現を許し,統計的学習ルーチンを備えた確率論理プログラミング言語処理系であるPRISM (programming in statistical modeling)を整備した.標準的ベンチマークセットであるカーネギーメロン大学のセミナー案内データ(CMU seminar)は単語数3,000を越える文章も含むが,この整備により比較的入手が容易な計算機での大量な処理も可能になった.一方,頻出パターン抽出技法を利用した,規則に基づく情報抽出器として知られる(LP)^2をJava言語で実装し,(LP)^2によって得られた規則を内包した確率モデルをPRISMで記述した.しかし,CRF (conditional random field)やサポートベクターマシンなどの情報抽出研究で行われている最新のベンチマーク結果に比較すると抽出精度は劣っており,現在の確率モデルのベースである動的ベイジアンネットワーク(dynamic Bayesian network)からCRFへ移行するなどの必要性があると考えられる.

  • Research Products

    (3 results)

All 2007 2006

All Journal Article (3 results)

  • [Journal Article] Discovering Concepts from Word Co-occurrences with a Relational Model2007

    • Author(s)
      Kurihara, K., Kameya, Y., Sato, T.
    • Journal Title

      Transactions of the Japanese Society for Artificial Intelligence 22・2

      Pages: 218-226

  • [Journal Article] 頻出部分木発見手法を用いた遺伝的プログラミングの交通信号制御問題への適用2007

    • Author(s)
      熊谷潤一, 小島康夫, 高重聡一, 亀谷由隆, 佐藤泰介
    • Journal Title

      人工知能学会論文誌 22・2

      Pages: 127-139

  • [Journal Article] Parallel EM Learning for Symbolic-Statistical Models2006

    • Author(s)
      Izumi, Y., Kameya, Y., Sato, T.
    • Journal Title

      Proceedings of the International Workshop on Data-Mining and Statistical Science

      Pages: 133-140

URL: 

Published: 2008-05-08   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi