• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2010 年度 実績報告書

多角的なWeb空間マイニングを実現するデータベース処理機構の研究

研究課題

研究課題/領域番号 21500096
研究機関電気通信大学

研究代表者

大森 匡  電気通信大学, 大学院・情報システム学研究科, 教授 (30233274)

キーワードWebウェアハウス / Webマイニング / データベースシステム / コミュニティ発見 / 問合せ処理 / コア計算アルゴリズム / データウェアハウス / データキューブ
研究概要

本研究の目的は、Web空間から集めたWebデータの集合に対し、入力として利用者が自分の興味を表す多様な制約条件を与え、当該制約を満たすようなWebコミュニティの構造情報を出力として返すデータベースシステムを実現することである。提案システムは、Webページのリンク構造を表すレコードについて、その始点ノードに制約を与える場合(FROM型制約)、終点ノードに制約を与える場合(TO型制約)、および時間軸の制約、の合計3次元の制約組み合わせを考え、これによって多様なコミュニティ構造への問合せを記述する。具体的には、本システムは、利用者の意図に応じて、FROM型・TO型制約と時間軸によって3次元データキューブモデルを構築し、それに基づいたデータベース演算体系を使って多様なコミュニティ構造問合せを効率的に計算するデータベースシステムである。平成23年度の成果は次の通り:
(1)利用者が任意のプール述語を用いてFROM型制約・TO型制約を定義し、それに基づいて昨年度から提案しているデータキューブモデルを構築する方法を与えた。さらに、当該データキューブの多次元制約に応じたコア集合を対象に、選択演算・マージ演算などの処理を効率的に差分実行するアルゴリズムを提案・実装した。これによって、利用者のニーズに応じた任意の制約組み合わせによる多角的Web空間マイニングを効率的に実現できるようになった。
(2)一方、本システムの出力であるランクつきコミュニティ構造グラフが実際に良いコミュニティ情報を与えているかを評価する必要がある。そのための一手法として、グラフ構造で表されたデータベースへのtop-Kキーワード検索アルゴリズムMDPBFを考案し、1万ノード級のグラフで10秒以内の検索効率を持つように試作を行った。アルゴリズム上の改良は必要だが、本システムの有効性評価には耐えうる計算効率を持つことを確認した。

  • 研究成果

    (3件)

すべて 2011 2010

すべて 学会発表 (3件)

  • [学会発表] Top-k Keyword Search with Redundancy Elimination on Large Graph Databases2011

    • 著者名/発表者名
      M.Wang, L.Zhang, T.Ohmori
    • 学会等名
      データ工学と情報管理に関するワークショップDEIM2011
    • 発表場所
      ラフォーレ伊豆(静岡県)
    • 年月日
      20110300
  • [学会発表] Exact Top-k Keyword Search on Graph Databases2011

    • 著者名/発表者名
      M.Wang, L.Jiang, L.Zhang, T.Ohmori
    • 学会等名
      ACM Symposium on Applied Computing, Data Mining Track(poster paper)
    • 発表場所
      Tunghai University(Taiwan)
    • 年月日
      20110300
  • [学会発表] A Report on Exact Top-k Keyword Search with Redundancy Elimination on Graph Databases2010

    • 著者名/発表者名
      王美蓉、張麗茄、大森匡
    • 学会等名
      情報処理学会データベースシステム研究会第151回, 2010-DBS-151-28
    • 発表場所
      早稲田大学(東京都)
    • 年月日
      20101100

URL: 

公開日: 2012-07-19  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi