研究概要 |
今年度はドクメンテーションのための各種のテキスト解析に重点をおき, (1)グローバルな抽象レベルでのテキスト解析 (2)ルールに基づいた推論理解のチェックとトレースによるオブジェクトレベルでのテキスト理解 (3)ソフトウェア開発保守への機械可読な自然言語表現の導入などの諸方法を開発することに目標を設定した. 項目(1)の研究は昨年度にひきつづき, 技術関係のテキストなどを対象として見出し情報などを併用してテキスト解析を行ない, 主要な情報を能率的に抽出する手法を検討した. テキストの多くは標題や節などの見出しを階層的にもち, これに従ってトップダウン的に記述される. このようなテキストの性質に着目し, 標題や見出しからフレームを検索し, テキスト構造に関するトップダウン的な情報と文や文節間の関係に関するボタムアップ的な情報を併用してテキスト解析を行ない, パラグラフや節などのブロックの主な内容を能率的に同定する方法を考察し, 実験的に検討した. また, 主要な情報を関係データベースに抽出したり, 要約文を生成する方法を検討した. 項目(2)の研究は本年度から新たに行なったものである. 論理回路のような専門分野のテキストにおいて, 基本素子機能に基づいてシステムやテバイスの動作や機能に関するテキストの説明的記述を理解することを試みた. このため先ずテキストの記述を形式的表現に変換し, これを検証しトレースしてテキストをオブジェクトレベルで理解する考察と実験を行なった. 項目(3)に関連して, 従来ライブラリモジュールを援用してプログラム仕様の詳細化や自動生成の研究を行なって来た. 今年度は日本語仕様から形式仕様への変換ならびに半自動的に詳細化された仕様の日本語表現の自動生成の考察と実験を行なった.
|