研究概要 |
本研究では語義の曖昧さ解消結果の有効性を示すために解消結果を情報検索の分野に適用した.具体的には文書の重要部分の抽出方法に関する提案を行なった.本研究でアピールする点,特に関連する研究との差異に注目した特徴は以下の通りである. 文脈依存の度合,すなわち,記事中の任意の語が,設定された文脈にどのくらい深く関わっているかという度合の強さを用いることで重要語を抽出する 従来より提案されている研究は,(a)ヒューリスティックスを用いたもの,(b)単語頻度などの情報を用いたもの,(c)シソ-ラスなどの意味情報を用いたものがある.(a)は対象分野が限定されてしまう,(b)は精度面,(c)はデータスパースネスの問題がそれぞれ指摘されている.本研究ではこの問題に対処するため,文書がどの分野に強く依存しているかという度合を用いることでその文書の重要語を抽出した(論文1参照). 実験では,人手により抽出したパラグラフと比較した結果,抽出率を30%とした場合,50記事の抽出総パラグラフ数84に対し,75パラグラフが正解であり正解率は89.2%に達した(論文2参照).
|