ドクメンテーションのための文章解析と情報抽出の研究

研究課題

研究課題/領域番号	62210015
研究種目	特定研究
配分区分	補助金
研究機関	大阪府立大学
研究代表者	西田富士夫大阪府立大学, 工学部, 教授 (50081287)
研究分担者	谷忠明大阪府立大学, 工学部, 教務技師高松忍大阪府立大学, 工学部, 助手 (00081290)
研究期間 (年度)	1987
研究課題ステータス	完了 (1987年度)
配分額 *注記	2,000千円 (直接経費: 2,000千円) 1987年度: 2,000千円 (直接経費: 2,000千円)
キーワード	見出し情報 / テキスト解析 / テキスト要約 / フレーム情報 / テキスト理解 / 推論による理解 / 日本語仕様 / プログラム自動生成
研究概要	今年度はドクメンテーションのための各種のテキスト解析に重点をおき, (1)グローバルな抽象レベルでのテキスト解析 (2)ルールに基づいた推論理解のチェックとトレースによるオブジェクトレベルでのテキスト理解 (3)ソフトウェア開発保守への機械可読な自然言語表現の導入などの諸方法を開発することに目標を設定した. 項目(1)の研究は昨年度にひきつづき, 技術関係のテキストなどを対象として見出し情報などを併用してテキスト解析を行ない, 主要な情報を能率的に抽出する手法を検討した. テキストの多くは標題や節などの見出しを階層的にもち, これに従ってトップダウン的に記述される. このようなテキストの性質に着目し, 標題や見出しからフレームを検索し, テキスト構造に関するトップダウン的な情報と文や文節間の関係に関するボタムアップ的な情報を併用してテキスト解析を行ない, パラグラフや節などのブロックの主な内容を能率的に同定する方法を考察し, 実験的に検討した. また, 主要な情報を関係データベースに抽出したり, 要約文を生成する方法を検討した. 項目(2)の研究は本年度から新たに行なったものである. 論理回路のような専門分野のテキストにおいて, 基本素子機能に基づいてシステムやテバイスの動作や機能に関するテキストの説明的記述を理解することを試みた. このため先ずテキストの記述を形式的表現に変換し, これを検証しトレースしてテキストをオブジェクトレベルで理解する考察と実験を行なった. 項目(3)に関連して, 従来ライブラリモジュールを援用してプログラム仕様の詳細化や自動生成の研究を行なって来た. 今年度は日本語仕様から形式仕様への変換ならびに半自動的に詳細化された仕様の日本語表現の自動生成の考察と実験を行なった.