2004 Fiscal Year Annual Research Report
Project/Area Number |
16680008
|
Research Institution | National Institute of Informatics |
Principal Investigator |
村田 剛志 国立情報学研究所, 知能システム研究系, 助教授 (90242289)
|
Keywords | インターネット高度化 / 人工知能 / ディレクトリ・情報検索 / Web構造マイニング |
Research Abstract |
2005年3月現在、サーチエンジンGoogleは80億ページ以上を収録している。今やWebは情報伝達における社会的なインフラとして利用されており、この膨大なWeb情報を活用する技術に関する研究は社会的なニーズに沿ったものである。本研究代表者はハイパーリンクのグラフ構造に基づいてWebページ間の関連性を見出すWeb構造マイニングの研究を進めている。Webページの多くは、関連するページへのハイパーリンクを有しており、Webコミュニティと呼ばれるグラフ構造を構成している。この構造についての知見を得ることは、Webから効率的な情報収集をする上で重要である。本研究の具体的な目標は以下の通りである。 (1)ハイパーリンクにおけるグラフ構造のモデル化 (2)Webコミュニティを利用した情報収集・活用 平成16年度においては、Webをはじめとする大規模ネットワークにおけるグラフ構造の有する性質について考察を行なうとともに、それを分析・視覚化するツール等の調査を重点的に行なった。成長と優先的選択の二つの特徴によって生成したネットワークがスケールフリーの性質を有することはBarabasiらによって示されたが、Pennockらは現実の特定トピックにおけるページの次数分布を説明するために優先的選択と均一選択の混合モデルを提案しており、前者の割合が高いトピックはe-commerceにおける競争が激しい分野であるとしている。今後は、グラフ構造とページ内容とを関連づけるこのような関連研究の調査を更に進めるとともに、得られた知見をベースに知的システム構築を行なっていく。
|