• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

1998 年度 実績報告書

大量テキストデータからの高度な情報抽出・検索方式の研究

研究課題

研究課題/領域番号 08458081
研究機関九州工業大学

研究代表者

野村 浩郷  九州工業大学, 情報工学部, 教授 (30208392)

研究分担者 永井 秀利  九州工業大学, 情報工学部, 助手 (60237485)
中村 貞吾  九州工業大学, 情報工学部, 講師 (40198221)
キーワード知的情報アクセス / 情報抽出 / 情報検索 / 情報要約
研究概要

インターネットなどのコンピュータネットワークの発展・普及にともない,その上の大量の情報から的確に情報を検索・抽出し,かつそれを要約するという知的情報アクセスの技術への社会的要請は極めて強いものになっている.そこで,本研究では,大量テキストデータからの情報検索,および情報抽出,および情報要約の研究を進めた.
これらの処理方式としては深い意味処理を行う方法の探求も考えられるが,現在および近い将来に予想される自然言語処理技術の成熟度では実現性に乏しく,また実現できたとしても処理に時間がかかりすぎコスト的にも不経済である.そこで,本研究では,言語表現の表層的な特徴を活用する高速でかつ精度の高い処理方式の提案をすべく研究を進めた.
まず,対話による情報検索の研究として,検索要求の内容の不確かさを親切で効率的な対話ナビゲーションによって解消し,かつ要求の言語表現の曖昧さをファジイ理論の応用により解決する方式を提案し,実験システムを作成して機能を検証した.
次に,情報抽出の研究として,新製品に関する新聞記事を対象として,情報表現の表層的な特徴に着目した高速で精度の高いテンプレート方式を提案し,実験システムを作成した.実験により,1記事中に1個の新製品に関する情報を含むような記事の場合で90%以上の精度を確認した.また,1記事中に複数個の新製品に関する情報を含むような記事についても,それらの情報を高速かつ高精度に抽出すべく研究を進めた.
さらに,情報要約の研究として,テキストにおける文タイプと文間関係の特徴付けに基づき重要な文のみを残し他を削除することにより,簡易で高速な要約作成方式を提案し,実験システムを作成して機能を検証した.
いずれの実験システムについても当研究室のWeb Pageでそれらの内容を紹介しており,処理材料に著作権などの問題がないものについてはインターネット上で実際に動かしてみれるようにしてある.

  • 研究成果

    (1件)

すべて その他

すべて 文献書誌 (1件)

  • [文献書誌] 高尾宜之、永井秀利、中村貞吾、野村浩郷: "複数製品の紹介記事からの製品情報抽出ー製品記述パターンの分析ー" 情報処理学会研究報告 自然言語処理研究会. 99・2. 117-124 (1999)

URL: 

公開日: 1999-12-11   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi