2009 Fiscal Year Annual Research Report
多角的なWeb空間マイニングを実現するデータベース処理機構の研究
Project/Area Number |
21500096
|
Research Institution | The University of Electro-Communications |
Principal Investigator |
大森 匡 The University of Electro-Communications, 大学院・情報システム学研究科, 准教授 (30233274)
|
Keywords | データベースシステム / Webマイニング / データキューブ / 問合せ処理 / データウェアハウス / コア計算アルゴリズム / コミュニティ発見 / Webウェアハウス |
Research Abstract |
本研究の目的は、対象とするWeb空間データ集合から、利用者が多様な制約条件を入力して、当該制約を満たすWebコミュニティ構造を返すようなデータベースシステムを実現することである。具体的には、リンク構造を表すレコード集合を対象に、リンクの始点に制約を与える場合(FROM型制約)と、終点に制約を与える場合(TO型制約)を考え、これらの制約の組み合わせにより、求めたいコミュニティ構造への問合せ条件を記述する。提案システムは、これらFROM型・TO型の2種類の制約の組み合わせと時間軸の合計3次元のデータキューブモデルで表されるデータベースシステムである。平成21年度は、FROM型・TO型制約の各々について、データキューブで言うロールアップ処理に相当するマージ演算の効率的な処理方法を提案した。また、「A学科ドメインとB学科ドメインの関係に注目したときに重要なコミュニティ構造を求めよ」などの複合的な問合せ処理を、フィルタリング演算とマージ演算の組み合わせで表現し、効率的に実行できることを示した。特にTO型制約におけるマージ演算のために、Pruningと呼ばれる技法を利用した差分計算処理方法を提案し、複合的問合せ処理においても十分効率的に動作することを示した。また、2005年度のuec.ac.jpドメイン以下のWeb空間データを対象として、学科に相当するサブドメイン所属か否かを引数にしたFROM型・TO型制約のデータキューブモデルを作り、代表的な問合せの処理効率と得られるコミュニティ構造の情報品質を調べ、良好な結果を得た。さらに、学科以外の任意ブール述語を引数としたデータキューブモデルの場合への処理アルゴリズムの適用も可能なことを示した。
|