• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

大量テキストデータからの高度な情報抽出・検索方式の研究

研究課題

研究課題/領域番号 08458081
研究種目

基盤研究(B)

配分区分補助金
応募区分一般
研究分野 知能情報学
研究機関九州工業大学

研究代表者

野村 浩郷  九州工業大学, 情報工学部, 教授 (30208392)

研究分担者 永井 秀利  九州工業大学, 情報工学部, 助手 (60237485)
中村 貞吾  九州工業大学, 情報工学部, 講師 (40198221)
研究期間 (年度) 1996 – 1998
研究課題ステータス 完了 (1998年度)
配分額 *注記
7,600千円 (直接経費: 7,600千円)
1998年度: 1,700千円 (直接経費: 1,700千円)
1997年度: 2,000千円 (直接経費: 2,000千円)
1996年度: 3,900千円 (直接経費: 3,900千円)
キーワード知的情報アクセス / 情報抽出 / 情報検索 / 情報要約 / 自然言語処理 / テキスト処理 / 大量テキスト / 対話処理 / ファジィ理論
研究概要

インターネットなどのコンピュータネットワークの発展・普及にともない,その上の大量の情報から的確に情報を検索・抽出し,かつそれを要約するという知的情報アクセスの技術への社会的要請は極めて強いものになっている.そこで,本研究では,大量テキストデータからの情報検索,情報抽出,および情報要約の研究を進めた.
これらの処理方式としては深い意味処理を行う方法の探求も考えられるが,現在および近い将来に予想される自然言語処理技術の成熟度では実現性に乏しく,また実現できたとしても処理に時間がかかりすぎコスト的にも不経済である.そこで,本研究では,言語表現の表層的な特徴を活用する高速でかつ精度の高い処理方式の提案をすべく研究を進めた.
まず,対話による情報検索の研究として,検索要求の内容の不確かさを親切で効率的な対話ナビゲーションによって解消し,かつ要求の言語表現の曖昧さをファジイ理論の応用により解決する方式を提案し,実験システムを作成して機能を検証した.
次に,情報抽出の研究として,新製品に関する新聞記事を村象として,情報表現の表層的な特徴に着目した高速で精度の高いテンプレート方式を提案し,実験システムを作成した.実験により,1記事中に1個の新製品に関する情報を含むような記事の場合で90%以上の精度を確認した.また,1記事中に複数個の新製品に関する情報を含むような記事についても,それらの情報を高速かつ高精度に抽出すべく研究を進めた.
さらに,情報要約の研究として,テキストにおける文タイプと文間関係の特徴付けに基づき重要な文のみを残し他を削除することにより,簡易で高速な要約作成方式を提案し,実験システムを作成して横能を検証した.
いずれの実験システムについても当研究室のWeb Pageでそれらの内容を紹介しており、処理材料に著作権などの問題がないものについてはインターネット上で実際に動かしてみれるようにしてある.

報告書

(4件)
  • 1998 実績報告書   研究成果報告書概要
  • 1997 実績報告書
  • 1996 実績報告書
  • 研究成果

    (10件)

すべて その他

すべて 文献書誌 (10件)

  • [文献書誌] 高尾宜之、永井秀利、中村貞吾、野村浩郷: "複数製品の紹介記事からの製品情報抽出-製品記述パターンの分析-" 情報処理学会研究報告、自然言語処理研究会. 99・2. 117-124 (1999)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1998 研究成果報告書概要
  • [文献書誌] Y.Takao, H.Nagai, T.Nakamura, H.Nomura: "Information Extraction from Newspaper Articles of Multiple Products" Proc.of Natural Language Processsing Interest Group, Information Processing Society of Japan. Vol.99, No.2. 117-124 (1999)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1998 研究成果報告書概要
  • [文献書誌] 高尾宜之、永井秀利、中村貞吾、野村浩郷: "複数製品の紹介記事からの製品情報抽出ー製品記述パターンの分析ー" 情報処理学会研究報告 自然言語処理研究会. 99・2. 117-124 (1999)

    • 関連する報告書
      1998 実績報告書
  • [文献書誌] 井出裕二: "単一項目テンプレートを用いた新聞記事からの製品情報抽出" 平成9年度電気関係学会九州支部連合大会論文集. 292-292 (1997)

    • 関連する報告書
      1997 実績報告書
  • [文献書誌] 井出裕二: "単一項目テンプレートによる新聞記事からの製品情報抽出" 情報処理学会研究報告 自然言語処理研究会. 97・109 97-NL-122. 63-70 (1997)

    • 関連する報告書
      1997 実績報告書
  • [文献書誌] 中村貞吾: "文タイプと文間関係に基づく要約処理" 言語処理学会第4回年次大会ワークショップ「テキスト要約の現状と将来」論文集. 50-55 (1998)

    • 関連する報告書
      1997 実績報告書
  • [文献書誌] 井出裕二: "構造化テンプレートを用いた新聞記事からの製品情報抽出" 情報処理学会研究報告 自然言語処理研究会. 97・29 97-NL-118. 7-14 (1997)

    • 関連する報告書
      1996 実績報告書
  • [文献書誌] 藤吉誠: "情報抽出処理のためのテンプレート作成" 電気関係学会九州支部連合大会講演論文集. No.1332. 694-694 (1996)

    • 関連する報告書
      1996 実績報告書
  • [文献書誌] 井出裕二: "テンプレートを用いた新聞記事からの製品情報抽出システム" 情報処理学会研究報告 自然言語処理研究会. 96・87 96-NL-115. 83-90 (1996)

    • 関連する報告書
      1996 実績報告書
  • [文献書誌] 野村浩郷: "電子化テキストコーパスの課題と展望" 情報処理学会「大規模テキストコーパスの作成と共有の問題点」シンポジウム. 1-6 (1996)

    • 関連する報告書
      1996 実績報告書

URL: 

公開日: 1996-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi