研究課題/領域番号 |
08458081
|
研究機関 | 九州工業大学 |
研究代表者 |
野村 浩郷 九州工業大学, 情報工学部, 教授 (30208392)
|
研究分担者 |
永井 秀利 九州工業大学, 情報工学部, 助手 (60237485)
中村 貞吾 九州工業大学, 情報工学部, 講師 (40198221)
|
キーワード | 情報抽出 / 情報要約 / 情報検索 / 自然言語処理 / テキスト処理 / 知的情報アクセス |
研究概要 |
インターネットなどのコンピュータネットワークの発展・普及にともない、その上の大量の情報から的確に情報を検索・抽出し、かつそれを要約するという知的情報アクセスの技術への社会的要請は極めて強いものになっている。そこで、本研究では、大量テキストデータからの情報検索、情報抽出、および情報要約の研究を進めた。これらの処理方式としては深い意味処理を行う方法の探究も考えられるが、現在および近い将来に予測される自然言語処理技術の成熟度では実現性に乏しく、また実現できたとしても処理に時間がかかりすぎコスト的にも不経済である。そこで、本研究では、言語表現の表層的な特徴を活用する高速でかつ精度の高い低コストの処理方式の提案をすべく研究を進めた。まず、対話による情報検索の研究として、検索要求の内容の不確かさを親切で効率的な対話ナビゲーションによって解消し、かつ要求の言語表現の曖昧さをファジィ理論の応用により解決する方式を提案し、実験システムを作成して機能を検証した。次に、情報抽出の研究として、新製品に関する新聞記事を対象として、情報表現の表層的な特徴に着目した高速で精度の高いテンプレート方式を提案し、実験システムを作成して90%以上の精度を確認した。さらに、情報要約の研究として、テキストにおける文タイプと文間関係の特徴付けに基づき重要な文のみを残し他を削除することにより、簡易で高速な要約作成方式を提案し、実験システムを作成して機能を検証した。いずれの実験システムについてもインターネットの当研究室のホームページに紹介があり、処理材料に著作権などの問題がないものについてはインターネット上で実際に動かしてみれるようにしてある。
|