本研究では、(1)サーチエンジンの収録内容の特徴発見(2)ハイパーリンクによる結合関係に基づくコミュニティ発見の二つを目標としたが、サーチエンジンにおけるページ収集アルゴリズムやその収録内容については外部に公開されていない部分が多く、収録内容の特徴の変化も速いことから、主として(2)についての研究を実施することにした。Webページのハイパーリンクによって構成されるグラフ構造に基づいて、興味を共有するWebページ集合であるWebコミュニティを発見するシステムを前年度に構築しており、今年度はそのシステムをさらに発展させて、当該トピックにおける中心的なページ集合を見出すような洗練手法を考案した。重要な内容をもつ中心的なWebページは他のページとのリンクが密であると考えられることから、2部グラフで表されるWebコミュニティにおいて、グラフが密になるようなページの選択を反復的に繰り返すように発見手法の改良を行なった。この手法に基づいたシステムを実現し、数十のトピックについてそのトピックに関するランキングの下位のページ集合を入力とし、洗練によって上位のページ集合が得られるかどうか実験を行なった。対象とするWebコミュニティのトピックによって効果に差はあるが、いくつかのトピックについて、そのトピックの中心的なページ集合を発見することに成功している。今年度の研究発表は上述のシステムに関するものを中心に行なった。その中の「Webコミュニティにおけるコアメンバーの発見」の口頭発表に対して、2001年度人工知能学会大会優秀論文賞の受賞が決定している。また、人工知能学会誌に投稿した論文の採録も決定している。
|