Research Abstract |
本研究では,新聞記事を対象とした情報検索に注目し,検索質問文が表す情報内容を扱うための第一歩として, (1)質問文を構成する各単語は本来全てが曖昧さを持っているということを前提とし,それらの言語的な多義性を同時に解消する (2)解消された各単語に対し,シソーラスを知識の構造,組織化の手段として導入し,検索質問文の各語について,シソーラス構造の中から拡張の対象となる階層を自動的に抽出することで質問文の拡張を行う ことを目的とする. 本年度は昨年度の(1)に引き続き,上記(2)に対し,シソーラス構造を自動的に抽出するために,関連記事を抽出する手法を提案し,TDT2を用いた実験では高精度で関連記事が抽出できることを示した(論文2).また,シソーラスの自動構築において,大量データからの統計量を用いて,分野の階層構造が,人手により作成された階層構造を用いて文書を分類する場合よりも高い精度で分類できることを明らかにした(論文4).また,分類過程において,人手により付与された分野名のうち,誤って付与された分野名を自動的に検出・修正する方法を提案し,シソーラス構造の構築に貢献できることを示した(論文1,3).さらに,語義の解消,シソーラス構造を用いて,質問文の拡張を行う手法を提案した(論文5).
|