新聞記事を利用した訴訟相談支援システムに対し、次に示す基本アルゴリズムを構築した。(1)新聞記事に対し、複合語の一部の省略をそれ以前の文を元に復元を試みる省略の解消を行う。(2)記事を、見出し、リード、1段落目、2段落目以後に分割し、各部分中の語句を抽出する。(3)それらの語句に対し、時系列を遡り検索する。この時、記事のブロック間での語彙の一致率と占有率に着目し、閾値以上の場合、同一事項とみなし、記事クラスとしてまとめる。この記事クラスに対し、キーワード検索を行い関連する文を表示する。本アルゴリズムに対し、交通事故事案に対象に机上評価を行った。その結果、検索能力に課題があることが明確になった。
|