研究課題
World Wide Webのリンク構造を有向グラフとみなしたWebグラフについての研究の黎明より6年あまりが経過したいま、われわれはそのモデルの再評価を行い、今年度はおもに以下の2つの観点からの研究を重点的に実施し、下記に示す重要な結果を得た。1.Webにアップロードされている情報を巨大なデータベースと見るとき、そこから有益な情報を発見するデータマイニング技術は不可欠かつ重要である。発見すべき対象として、コンテンツ、構造、利用法などがあるが、われわれは構造のマイニングに興味があり、昨年度は2部クリークによって特徴づけられる構造を列挙する手法を提案し、それが表すと考えられるコミュニティを発見するプログラムを実装した。今年度は新たに、孤立クリークという概念によって特徴づけられる構造に着目し、同様にそれによって定義されるコミュニティを列挙し、その意味を解析した。2.過去の研究結果から、リンク構造が定義するWebグラフは、従来のランダムグラフモデルとは根本的に異なった性質を持っていることが明らかになってきており、その性質の一つに冪乗則分布とよばれるものがある。ここでも1と同様に孤立クリークの概念を用いて、実際のWebグラフの持つ構造的な性質を明らかにした。これらの中には従来考えられていたモデルでは説明できない未解明の現象もある。今年度得られた上記2つの結果は、サーチエンジン、クローラやランクアルゴリズムなどのウェブ・アルゴリズムで、効率的に動作するものを設計することに直結すると考える。また、さまざまな観察結果を表現する適切なウェブグラフモデルの提案も重要である。来年度以降、今年度の成果を公表するとともに、引き続きこれらの問題を解決することが重要であると考える。
すべて 2005 2004
すべて 雑誌論文 (5件)
IEICE Technical Report, SIG-COMP (発行予定)
Proc.17th IFORS Conference (発行予定)
IEICE Technical Report, SIG-COMP 104,55
ページ: 53-60
Lecture Notes in Computer Science (Springer) 3341
ページ: 871-883
Proc.Int'l Symp.on Discrete Algorithms and Optimization
ページ: 11-11