情報検索では、従来は単語をキーとする検索が行われてきたが、単語に限らず句(複数の単語からなるまとまった表現)をキーとした検索もできれば、ユーザは検索の意図をより的確に表現することができる。句は係り受け関係をもつ単語の集まりとして捉えることができる。本年度の研究では、そのための自然言語処理システムを確立するために、昨年度試作した日本語文の形態素解析・構文解析システムに改良を加え、PC上の日本語文解折システムとして統合した。現在のところ、解析精度は文節解析が98%程度、構文解析が90%程度である。また、固有名詞などの未登録語の問題とも絡んで複合語の解析は大きな問題であるが、本年度は漢字複合語の単語分割、構造解析の処理手法について研究した。これらの解析システムを用いて、新聞記事を対象とした情報検索システムを試作した。複合語の解析を含めた解析精度の更なる向上と、検索文作成の際のシソーラスなど関連語に関する扱いが今後の課題である。
|