研究概要 |
概念図の持つパターン情報と,説明文の自然言語情報とを統合し,計算機により自動的に多くの情報を文書から取り出すための方法について,以下のような研究を行なった. 1.パターン情報と概念との対応のバリエーションを詳細に検討し,概念図におけるパターン情報の使われ方を調査した,その結果,概念図の書き方(意味的構造)には小数の規則のようなものがあり,それが比較的よく守られていることが明らかになった.例えば,典型的なものとしては,物質や情報の流れ,変化,その他の相互作用を表す図の構成規則などがあげられる. 2.上記のように得られた複数の概念図の構成規則のうち,実際にどれを基にして図が構成されているかを判断するために,説明文を自然言語処理した結果を用いる方法を明らかにした.具体的には,説明文の動詞の語彙的な知識,格フレームなどの情報を用いることにより,対応する意味的構造を矛盾なく絞り込む方法について研究行った. 3.また,得られた意味的構造を用いることによって,説明文で述べられていない情報を概念図から取り出すことについて検討を行なった.実際に,多くの情報を抽出することができることが実験で明らかになった. 4.上記の処理により得られた結果は,お互いに対応づけの行なわれたパターン情報とテキスト情報である.これを用いて実際にハイパーテキストを構築し,人間にわかりやすい形で提示するシステムを試作した.このシステムでは,ユーザが図中の知りたい部分を指示すると,その部分の持つ意味を自動的に提示したり,本文中の説明部分,関連部分との相互参照を行うことができる. なお,本補助金で,自然言語辞書,概念図データ等の大量のデータを格納するための,大容量の補助記憶装置(固定磁気ディスク)を備品として購入した.
|