本研究では、(1)Webコミュニティにおける構造のモデル化(2)Webコミュニティにおける動的変化の検出の二つを目標としたが、今年度は今後実験を進めていくための準備作業や、従来から行なってきた実験をさらに発展させる形で研究を進めた。前者としてはNTCIRのテストコレクションとして収集しているWebデータのリンク情報を利用するために、その大きさやデータ構造等についての調査を行なった。後者としては、Webページのハイパーリンクによって構成されるグラフ構造に基づいて、興味を共有するWebページ集合であるWebコミュニティを発見するシステムを既に構築しており、そのシステムをさらに発展させて当該トピックにおける中心的なページ集合を見出すような洗練手法を考案した。重要な内容をもつ中心的なWebページは他のページとのリンクが密であると考えられることから、2部グラフで表されるWebコミュニティにおいて、グラフが密になるようなページの選択を反復的に繰り返すように発見手法の改良を行なった。この手法に基づいたシステムを実現し、数十のトピックについてそのトピックに関するランキングの下位のページ集合を入力とし、洗練によって上位のページ集合が得られるかどうか実験を行なった。対象とするWebコミュニティのトピックによって効果に差はあるが、いくつかのトピックについて、そのトピックの中心的なページ集合を発見することに成功している。今年度の研究発表は上述のシステムに関するものを中心に行なった。その中の「Webコミュニティにおけるコアメンバーの発見」の口頭発表に対して、2001年度人工知能学会大会優秀論文賞の受賞が決定している。また、人工知能学会誌に投稿した論文の採録も決定している。
|