1998 Fiscal Year Annual Research Report
大量テキストデータからの高度な情報抽出・検索方式の研究
Project/Area Number |
08458081
|
Research Institution | Kyushu Institute of Technology |
Principal Investigator |
野村 浩郷 九州工業大学, 情報工学部, 教授 (30208392)
|
Co-Investigator(Kenkyū-buntansha) |
永井 秀利 九州工業大学, 情報工学部, 助手 (60237485)
中村 貞吾 九州工業大学, 情報工学部, 講師 (40198221)
|
Keywords | 知的情報アクセス / 情報抽出 / 情報検索 / 情報要約 |
Research Abstract |
インターネットなどのコンピュータネットワークの発展・普及にともない,その上の大量の情報から的確に情報を検索・抽出し,かつそれを要約するという知的情報アクセスの技術への社会的要請は極めて強いものになっている.そこで,本研究では,大量テキストデータからの情報検索,および情報抽出,および情報要約の研究を進めた. これらの処理方式としては深い意味処理を行う方法の探求も考えられるが,現在および近い将来に予想される自然言語処理技術の成熟度では実現性に乏しく,また実現できたとしても処理に時間がかかりすぎコスト的にも不経済である.そこで,本研究では,言語表現の表層的な特徴を活用する高速でかつ精度の高い処理方式の提案をすべく研究を進めた. まず,対話による情報検索の研究として,検索要求の内容の不確かさを親切で効率的な対話ナビゲーションによって解消し,かつ要求の言語表現の曖昧さをファジイ理論の応用により解決する方式を提案し,実験システムを作成して機能を検証した. 次に,情報抽出の研究として,新製品に関する新聞記事を対象として,情報表現の表層的な特徴に着目した高速で精度の高いテンプレート方式を提案し,実験システムを作成した.実験により,1記事中に1個の新製品に関する情報を含むような記事の場合で90%以上の精度を確認した.また,1記事中に複数個の新製品に関する情報を含むような記事についても,それらの情報を高速かつ高精度に抽出すべく研究を進めた. さらに,情報要約の研究として,テキストにおける文タイプと文間関係の特徴付けに基づき重要な文のみを残し他を削除することにより,簡易で高速な要約作成方式を提案し,実験システムを作成して機能を検証した. いずれの実験システムについても当研究室のWeb Pageでそれらの内容を紹介しており,処理材料に著作権などの問題がないものについてはインターネット上で実際に動かしてみれるようにしてある.
|
Research Products
(1 results)