Research Abstract |
本研究の目的は,英文科学技術文献抄録文の理解である.ここで,抄録文の理解とは,抄録文の内容を,専門語句をノ-ドとする意味ネットワ-クで表現することをいう.次の三つについて研究を行なっている. (1)抄録文の用例調査に基づく機能語動詞の統語・意味情報の抽出 (2)抄録文における専門用語の切り出し (3)抄録文理解システムを実現するためのツ-ルの開発 今年度の研究成果は次の通りである.(1)に関しては,主題記述に用いられる五つの高頻度動詞show,present,study,describe,discussについて,INSPECテ-プの抄録文11万文を対象に用例調査を行ない,統語・意味情報を抽出した.これらの動詞は,64%の抄録に出現する.また,この調査を通じて,抄録文における動詞候補間には,動詞となり得るための優先順位があることがわかった。少なくとも,五つの動詞を含む抄録文については,文脈自由文法に基づく構文解析によらず,動詞句を決定することができる。したがって,これらの抄録文については,論文の主題に関する意味ネットワ-クを作ることができる.この成果は,情報検索システムにおける主題検索の質の向上に寄与し得る.(2)については,(1)の統語・意味情報から方式を確立できると考えている。少なくとも,五つの主題記述動詞については,その統語・意味情報から,専門語句を主部あるいは目的部として特定することができる.(3)については,構文解析,意味解析,意味ネットワ-クの作成並びに意味ネットワ-クに基づく推論には,われわれが3年前から開発しているル-ルベ-スシステムSeepを用いる.今年度は,Seepが実用環境に耐え得るかの検証を行なった。また,2次記憶上のデ-タベ-スのためのB木処理の洗練を図った.
|