研究概要 |
インターネットの普及により,膨大かつ多様な情報がネットワーク上に溢れている.このような状況において,ユーザが指定した出来事に対し,その発生から後の経過を示す一連の内容を提示する技術(続報記事抽出)は,情報活用としての知的アクセス基盤を提供するだけでなく,予測発見の技術としても期待されている.本研究では,意味を考慮することでユーザが指定した出来事に対する一連の記事を高精度で抽出・提示することを目的とする.具体的には,日英報道記事に焦点をあて,各記事に対し,(1)話題,及び話題の推移を示す名詞と動詞に注目し,それら品詞単語の多義を解消した後,同義クラスに置き換える,(2)照応解析を行った後,不要な文を削除し,各記事を話題を示す文のみで示す,(3)文で表現された日英の各記事を比較することで日英関連記事を抽出する,(4)(3)の結果を用いてユーザが指定した出来事に関する一連の記事を高精度で抽出し,提示する手法を提案した.
|