• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

ドクメンテーションのための文章解析と情報抽出の研究

研究課題

研究課題/領域番号 61220010
研究種目

特定研究

配分区分補助金
研究機関大阪府立大学

研究代表者

西田 富士夫  阪府大, 工学部, 教授 (50081287)

研究分担者 高松 忍  大阪府立大学, 工学部, 助手 (00081290)
藤田 米春  大阪府立大学, 工学部, 助手 (70081289)
研究期間 (年度) 1986
研究課題ステータス 完了 (1986年度)
配分額 *注記
2,000千円 (直接経費: 2,000千円)
1986年度: 2,000千円 (直接経費: 2,000千円)
キーワード見出し情報 / テキスト解析 / テキスト要約 / フレーム情報 / コヒーレント情報 / ドクメンテーションの自動化
研究概要

この研究は科学技術研究報告や新聞雑誌などに含まれる主要情報をテキスト解析により同定し、これから目的に応じていろいろな情報抽出を行なわうとするものである。このため各専門分野や、記述対象の物あるいは性質,関係,事象ごとに、いくつかのフレーム情報を用意しておく。そして与えられたテキストの標題,各節の見出しなどから試行錯誤的に選定したフレーム情報と、テキストを構文解析してえられたパラグラフや文節間のコヒーレント情報を用いてトップダウン的、且、ボタムアップ的にテキスト解析を行ない、テキストに含まれている主要情報を同定する。また主要情報を構成する要素などに関する補足情報については、対応するフレーム情報などを参照して必要なレベルまで同定し、フレームの形式に標準化する。
このような方法により、机上実験及び計算機実験を行なったところ、特許関係の文書や科学技術や社会経済などの新聞報道記事など、フレームの項目や内容の種類に関して多様性が大きくないものについては、実用上かなりよい見通しがえられた。しかし一般の技術論文などは、新しく知見がえられた特定事項に記述が集中し、記述形式や内容が多様であって、主要情報抽出の自動化のため、今後の研究が必要である。なお、このようにして求めたテキストの解析結果から、指定された長さ以下の要約文を生成する問題や、関係データベースに主要なフレーム情報を抽出する方法について、考察と実験を行なった。
今後はこのような方向で考察と実験を進めるとともに、ドクメンテーションのための能率的なデータベースの構築と更新などについても考察を進めたい。

報告書

(1件)
  • 1986 実績報告書
  • 研究成果

    (4件)

すべて その他

すべて 文献書誌 (4件)

  • [文献書誌] Nishida,F.: 11th COLING. 241-243 (1986)

    • 関連する報告書
      1986 実績報告書
  • [文献書誌] Nishida,F.: 11th COLING. 649-651 (1986)

    • 関連する報告書
      1986 実績報告書
  • [文献書誌] 高松忍: 情報処理学会第32回全国大会. 5M-1. 1261-1262 (1986)

    • 関連する報告書
      1986 実績報告書
  • [文献書誌] 高松忍: 情報処理学会第33回全国大会. 4L-2. 1223-1224 (1986)

    • 関連する報告書
      1986 実績報告書

URL: 

公開日: 1987-03-31   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi