2006 Fiscal Year Annual Research Report
分散型ワーカモデル,グリッド環境における並列データマイニング処理の研究
Project/Area Number |
06J00205
|
Research Institution | Hiroshima City University |
Principal Investigator |
高木 允 広島市立大学, 大学院・情報科学研究科, 特別研究員(DC1)
|
Keywords | データマイニング / 並列処理 |
Research Abstract |
1.配列データベースであるアミノ酸配列からモチーフとなりうる頻出パターンを抽出するための手法であるModified PrefixSpan法を,グリッド環境下において分散型ワーカモデルを用いて並列化を行った.各計算機の負荷を均等にするための動的負荷分散手法を提案した.提案手法は,グリッド環境において問題となる通信遅延による処理時間の増加を低減し,Modified PrefixSpan法特有の負荷の偏りによる処理時間の増加を抑える手法である.提案手法の有効性を示すために,仮想的なグリッド環境下で提案手法と既存の動的負荷分散手法の比較を行った.比較の結果,提案手法は既存手法に比べ,高速に頻出パターンを抽出することが可能となっており,提案手法の有効性を示すことができた.また,Grid Challenge in SACSIS 2006において,実際のグリッド環境下で実験を行い提案手法の有効性を示した,得られた研究成果を国際会議(Proceedings of The 2006 International Conference on Parallel and Distributed Processing Techniques and Applications)に投稿し,口頭発表を行った. 2.配列データベースを対象としたデータマイニング手法のみではなく,グラフを対象としたデータマイニング手法について調査するため,研究会に参加し最新の研究の動向調査を行った.特に,近年注目されているWeb空間・ブログ空間からのコミュニティ発見についての研究の調査を行った. 3.2.の研究調査を踏まえ,ブログ記事をグラフ化したデータから頻出部分グラフの抽出を行い,有用な知識を発見するため,ブログの書き手であるブロガーをひとつのノード,トラックバックによる繋がりを辺としたグラフから頻出なコミュニティの発見を行うための手法を提案した.ブログ空間からのコミュニティ抽出についての既存の研究では,頻出という概念を導入しておらず,本手法を用いることでブログ空間から頻出なコミュニティを発見できる.頻出なコミュニティを発見することで,よりコアで正確なコミュニティを発見することができる.実際にブログ記事を収集し,ブロガーで構成されたグラフから頻出なコミュニティの発見を行った.実験の結果,頻出という概念を用いることで特定の話題に特化したコミュニティを正確に発見できた.得られた研究成果をデータベースとWeb情報システムに関するシンポジウムにおいてポスター発表した.また,成果を論文にまとめ,電子情報通信学会第18回データ工学ワークショップに投稿し,口頭発表とポスター発表を行った.今後,グラフマイニングについての並列化手法を検討している.
|
Research Products
(2 results)