研究概要 |
教科書やマニュアルにはそれぞれ基本的な知識とノウハウ的な知識が記載されている。この知識を抽出するためには単に文章を理解するだけではなく,引用されている図や表を理解できなくてはならない。その際我々がとる読み方としては(1)文を読み,必要に応じて図を見る,(2)図を見て文を補助的に利用する,(3)両者を入念に読む,(4)既に獲得している知識を利用して不足する部分だけを読む,といった様々な形態が考えられる。勿論我々とコンピュ-タとでは図や表を読む能力に大きな差異がある。我々は大局的な視覚能力を有するが,コンピュ-タは局所的な能力しかもっていないため,図の方法や利用法が異なっている。局所的な視覚能力しか持っていないコンピュ-タにとって,言語記述から得る情報には大局的なものが含まれるため,図や表の解析にプランを与えることができ,解析効率を向上させることが期待される。 実際に図と文とを含んだ文書を処理するためには両者の分離が必要となるが,図や表の中にも文や句が書かれている。そこで階層的な分割を行なった。次に図や表には本来の図や表の成分でない図形要素が含まれていることが多いため,それらを分離した。その際分離による図形の欠損が生じるがその修復には背景図形の意味が必要になる。そのため背景の処理と修複を並行して行うことにより,どのような図形成分が存在するかをもとめる方式を考察した。この方式を機械部品組立てマニュアルに適用して,組立説明図と文とを抽出し,それぞれ互いに独立に処理を行なった。これは上記の(3)に該当する。残念ながら図と文とを独立して解析しても何をすべきかは理解されなかった。しかし両者の記述の照合を行なう推論システムを仲介させることにより,正しい組立て手順を得ることに成功した。
|