研究概要 |
本研究では,新聞記事を対象とした情報検索に注目し,検索質問文が表す情報内容を扱うための第一歩として, (1)質問文を構成する各単語は本来全てが曖昧さを持っているということを前提とし,それらの言語的な多義性を同時に解消する (2)解消された各単語に対し,シソーラスを知識の構造,組織化の手段として導入し,検索質問文の各語について,シソーラス構造の中から拡張の対象となる階層を自動的に抽出することで質問文の拡張を行う ことを目的とする.本研究の具体的な項目と研究内容は以下の通りである. (1)関連記事のトラッキング 上記(2)に対し,シソーラス構造を自動的に抽出するために,関連記事を抽出する手法を提案し,TDT2を用いた実験では高精度で関連記事が抽出できることを示した(論文2). (2)タグ誤りの自動検出と修正 語義解消を行うコーパスの不均質の問題に対処するため,あらかじめ人手により付与されたタグの誤りを自動的に検出し,修正する手法を提案した(論文1,3,6). (3)階層構造の自動構築 シソーラスの自動構築において,大量データからの統計量を用いて,分野の階層構造が,人手により作成された階層構造を用いて文書を分類する場合よりも高い精度で分類できることを明らかにした(論文4). (4)情報検索のための語義解消 語義の解消,シソーラス構造を用いて,質問文の拡張を行う手法を提案した(論文5).
|