本研究の目的は、Web空間から集めたWebデータの集合に対し、入力として利用者が自分の興味を表す多様な制約条件を与え、当該制約を満たすようなWebコミュニティの構造情報を出力として返すデータベースシステムを実現することである。提案システムは、Webページのリンク構造を表すレコードについて、その始点ノードに制約を与える場合(FROM型制約)、終点ノードに制約を与える場合(TO型制約)、および時間軸の制約、の合計3次元の制約組み合わせを考え、これによって多様なコミュニティ構造への問合せを記述する。具体的には、本システムは、利用者の意図に応じて、FROM型・TO型制約と時間軸によって3次元データキューブモデルを構築し、それに基づいたデータベース演算体系を使って多様なコミュニティ構造問合せを効率的に計算するデータベースシステムである。平成23年度の成果は次の通り: (1)利用者が任意のプール述語を用いてFROM型制約・TO型制約を定義し、それに基づいて昨年度から提案しているデータキューブモデルを構築する方法を与えた。さらに、当該データキューブの多次元制約に応じたコア集合を対象に、選択演算・マージ演算などの処理を効率的に差分実行するアルゴリズムを提案・実装した。これによって、利用者のニーズに応じた任意の制約組み合わせによる多角的Web空間マイニングを効率的に実現できるようになった。 (2)一方、本システムの出力であるランクつきコミュニティ構造グラフが実際に良いコミュニティ情報を与えているかを評価する必要がある。そのための一手法として、グラフ構造で表されたデータベースへのtop-Kキーワード検索アルゴリズムMDPBFを考案し、1万ノード級のグラフで10秒以内の検索効率を持つように試作を行った。アルゴリズム上の改良は必要だが、本システムの有効性評価には耐えうる計算効率を持つことを確認した。
|