情報検索では、従来は単語をキ-とする検索が行われてきたが、単語に限らず句(複数の単語からなるまとまった表現)をキ-とした検索もできれば、ユーザは検索の意図をより的確に表現することができる。句は係り受け関係をもつ単語の集まりとして捉えることができるが、本テーマの下、本年度の研究では、日本語文の形態素解析:構文解析システムを試作し、それを応用した、2単語間の係り受け関係を指定できる全文情報検索のパイロットシステムを試作した。このシステムを特許情報データベースに適用した種々評価を行った。近接演算を用いた場合と係り受け関係を用いた場合の検索精度等についての比較では、係り受け関係を用いる場合の適合率が、おおむね84%から96%に向上するという実験結果を得た。次年度は、解析システムについてさらに改良を加え、また検索システムについてもインデクシングの手法、係り受け関係の照合手法の改良を行っていく予定である。
|