研究実績の概要 |
ウェブのリンク構造は通常ウェブグラフとして表現され,ウェブ上で動作するさまざまなアルゴリズム設計の基礎的なモデルである.このウェブグラフはしかしながら,リンク構造のある瞬間のスナップショットにすぎず,動的に変化し成長を続けるリンク構造の様子 を表現するには不十分である.そこで本研究の主たる目的は,変化・成長するリンク構造を時系列データとしてとらえ,1. ウェブ時系列データを表現するモデルを構築すること,および 2. そのモデルをもとに, ウェブに潜む新たな知識を時系列データから発見するためのデータマイニング・アルゴリズムを設計・開発することを目指している.
本研究課題は,計画期間全体を通して時系列データをいかに表現するかというモデル化そのものに取り組んだ.時系列データは,単純にはスナップショットであるウェブグラフ1つ以上からなるグラフ族と考えられるが,1つでも数百億以上のノードからなるグラフを複数保持する表現は,物理的なメモリの限界とともに,さまざまなウェブアルゴリズムの効率的な動作が期待できない.ノードやリンクの動的に変化する差分だけを保持する方法などが考えられるが,個別のアルゴリズムを想定した最適な表現方法を考案しなければならない.これまでに提案したウェブグラフの時系列データを,グラフとグラフの各枝が存在する時区間のペアとして定義する方法をさらに拡張することを考え,長い時間存在するクリークをより効率的に列挙する方法を考察した.また,それ以外の重要な構造の時系列データ上での定義も新たに手がけた.
最終年度である26年度は,これまでに提案した時系列モデルを発展させ,より一般的なモデルへと拡張させることに成功した.また,ウェブグラフに関連して派生するさまざまなグラフ問題に着目し,それらを効率的に解くアルゴリズムを開発した.
|