本研究の目的は、分析したいWeb空間のデータ集合をデータベースDとして維持し、問い合わせとして利用者が知りたいWebコミュニティに関する制約条件Qを与えた時に、Qを満たすWebコミュニティ構造をDから効率良く計算するシステムを実現することである。具体的には、Webリンク構造を表すレコード集合を対象に、リンクの始点ノードに制約を与える場合(「FROM型」制約と呼ぶ)と終点ノードに制約を与える場合(「TO型」制約)の2種類の制約を考え、多様なコミュニティ構造への問合せQをFROM型とTO型の2次元の制約から作られたデータキューブモデルの下での制約で表す。制約に用いる述語としては、大学のWeb空間データであれば、「情報系学科から見て重要なコミュニティを求めよ」など分野別のドメイン階層を表す述語や、「キーワードKを満たすページから出方向リンクに沿ってNホップ以内のコミュニティを求めよ」などの一般的な述語を許す。システムは、当該制約に応じた適切なコア(完全2部グラフ)計算を行なってそこからコミュニティ構造を表すグラフを求める。以上によって、「情報系学科と機械系学科の相互関係を重視したときのコミュニティ構造を求めよ」などのパーソナライズされたWebコミュニティ計算ができる。今年度は、昨年度までに実現した処理演算システムを用いて、uec.ac.jp下の分野別ドメイン階層の下で発見されるコミュニティ構造や、「ロボット関連」「COE関連」などキーワードKに関するコミュニティ構造を計算し、その内容の有用性と問い合わせ処理時間を調べた。その結果、相異なるキーワードで類似度の高いコミュニティ構造が出てくる場合や、分野AとBの相互関係で見ると初めて高順位になるコミュニティなどを効率よく見つけることができた。この他、出力となるコミュニティ構造グラフの利用ツールを意図した昨年のDPBF法、MDPBF法との対比用に、半構造データベースのキーワード検索技術も開発した。
|