研究概要 |
インターネットなどのコンピュータネットワークの発展・普及に伴い,その上の多量の情報から的確に情報を抽出・検索する技術への社会的要請は極めて強いものになっている.そこで、本研究では,大量テキストデータからの情報抽出方式と情報検索方式の二つの研究を進めた。情報の抽出・検索の処理としては,深い意味処理を行う方法も考えられるが,現在の自然言語処理技術の成熟度では実現性に乏しく,また、コスト的に不経済である.そこで本研究では,まず、新聞記事からの情報抽出の研究として、情報の表層的な特徴に基づくテンプレートというものを提案し,それによる高速でかつ精度の高い低コストの情報抽出方式を提案し、約10年分の新聞記事を分析することによりそのテンプレートの作成と記述と適用の方法を工夫して効率化し、それらに基づき実際に実験システムを作成してその機能を検証した。この実験システムは、インターネットの当研究室のホームページで実際に動かしてみれるようにしてある。次に、対話による情報検索の研究として、検索要求の内容の曖昧さを適切で効率的な対話によって解消し、かつ要求の言語表現の曖昧さをファジイ論理の応用により適切に解決する柔軟で親切な旅行申込対話処理方式を提案し、旅行対話を内容とするATRコーパスを分析することによりその適用や評価の方法を工夫して効率化し、それらに基づき実際に実験システムを作成してその機能を検証した。この実験システムもインターネットの当研究室のホームページで実際に動かしてみれるようにしてある。
|