配分額 *注記 |
7,600千円 (直接経費: 7,600千円)
1998年度: 1,700千円 (直接経費: 1,700千円)
1997年度: 2,000千円 (直接経費: 2,000千円)
1996年度: 3,900千円 (直接経費: 3,900千円)
|
研究概要 |
インターネットなどのコンピュータネットワークの発展・普及にともない,その上の大量の情報から的確に情報を検索・抽出し,かつそれを要約するという知的情報アクセスの技術への社会的要請は極めて強いものになっている.そこで,本研究では,大量テキストデータからの情報検索,情報抽出,および情報要約の研究を進めた. これらの処理方式としては深い意味処理を行う方法の探求も考えられるが,現在および近い将来に予想される自然言語処理技術の成熟度では実現性に乏しく,また実現できたとしても処理に時間がかかりすぎコスト的にも不経済である.そこで,本研究では,言語表現の表層的な特徴を活用する高速でかつ精度の高い処理方式の提案をすべく研究を進めた. まず,対話による情報検索の研究として,検索要求の内容の不確かさを親切で効率的な対話ナビゲーションによって解消し,かつ要求の言語表現の曖昧さをファジイ理論の応用により解決する方式を提案し,実験システムを作成して機能を検証した. 次に,情報抽出の研究として,新製品に関する新聞記事を村象として,情報表現の表層的な特徴に着目した高速で精度の高いテンプレート方式を提案し,実験システムを作成した.実験により,1記事中に1個の新製品に関する情報を含むような記事の場合で90%以上の精度を確認した.また,1記事中に複数個の新製品に関する情報を含むような記事についても,それらの情報を高速かつ高精度に抽出すべく研究を進めた. さらに,情報要約の研究として,テキストにおける文タイプと文間関係の特徴付けに基づき重要な文のみを残し他を削除することにより,簡易で高速な要約作成方式を提案し,実験システムを作成して横能を検証した. いずれの実験システムについても当研究室のWeb Pageでそれらの内容を紹介しており、処理材料に著作権などの問題がないものについてはインターネット上で実際に動かしてみれるようにしてある.
|