研究課題/領域番号 |
17500097
|
研究機関 | 広島市立大学 |
研究代表者 |
北上 始 広島市立大学, 情報科学研究科, 教授 (50234240)
|
研究分担者 |
黒木 進 広島市立大学, 情報科学研究科, 准教授 (20225288)
森 康真 広島市立大学, 情報科学研究科, 助教 (60264959)
田村 慶一 広島市立大学, 情報科学研究科, 助教 (80347616)
|
キーワード | データマイニング / 最的化 / 曖昧表現 / 分散並列処理 / ギブスサンプラー / サフィックス木 |
研究概要 |
制約データベースに対する制約問合せ処理では、制約問題の解消法の研究が中心的な課題となる.3年目である平成19年度は、さまざまな制約問題に着目し、以下の項目について機能設計を行った. 1.文字列制約の解消:配列データベースに対して、以下の2点の機能設計を行った. (1)可変長ワイルドカード領域をもつ頻出パターンの抽出 ギブスサンプラーを用いて、不要な頻出パターンを除去する方法について明らかにした.また、ギブスサンプラーの収束性が良くないことがわかったので、収束性を向上させる方法についても検討を行っている.最終年度にその方法を明らかにする予定である. (2)曖昧文字表現を含む頻出パターンの抽出 ディスク上のサフィックス木を用いて、曖昧文字表現を含む頻出パターンの抽出をトップダウン探索により行う方法を明らかにした. 2.幾何学構造に関する制約の解消:ブログ世界を空間的にとらえ、重複を許したコミュニティを抽出する方法について明らかにした.また、異種系統樹間の交差を取り除くために効果的な最適化手法を明らかにした.さらに、空間データマイニング処理の高速化についても基礎的な検討を行った. 3.分散並列処理による高速化:ディスク上のサフィックス木を並列構築する方法を明らかにした.評価実験では、良好な台数効果を確認した. 4.制約問合せ言語の枠組み:本研究の制約問合せ言語の枠組みを検討する中で、不要な頻出パターン除去制約、重複コミュニティ抽出制約、交差数減少制約等を洗い出した.
|