研究課題
2005年3月現在、サーチエンジンGoogleは80億ページ以上を収録している。今やWebは情報伝達における社会的なインフラとして利用されており、この膨大なWeb情報を活用する技術に関する研究は社会的なニーズに沿ったものである。本研究代表者はハイパーリンクのグラフ構造に基づいてWebページ間の関連性を見出すWeb構造マイニングの研究を進めている。Webページの多くは、関連するページへのハイパーリンクを有しており、Webコミュニティと呼ばれるグラフ構造を構成している。この構造についての知見を得ることは、Webから効率的な情報収集をする上で重要である。本研究の具体的な目標は以下の通りである。(1)ハイパーリンクにおけるグラフ構造のモデル化(2)Webコミュニティを利用した情報収集・活用平成16年度においては、Webをはじめとする大規模ネットワークにおけるグラフ構造の有する性質について考察を行なうとともに、それを分析・視覚化するツール等の調査を重点的に行なった。成長と優先的選択の二つの特徴によって生成したネットワークがスケールフリーの性質を有することはBarabasiらによって示されたが、Pennockらは現実の特定トピックにおけるページの次数分布を説明するために優先的選択と均一選択の混合モデルを提案しており、前者の割合が高いトピックはe-commerceにおける競争が激しい分野であるとしている。今後は、グラフ構造とページ内容とを関連づけるこのような関連研究の調査を更に進めるとともに、得られた知見をベースに知的システム構築を行なっていく。
すべて 2005 2004
すべて 雑誌論文 (2件) 図書 (1件)
Proceedings of the Third International Workshop on Social Intelligence Desin (SID 2004)
ページ: 111-118
Proceedings of the Third International Conference on the Theory and Application of Diagrams (Diagrams 2004), LNAI2980
ページ: 235-238