2014 Fiscal Year Annual Research Report
省メモリWebマイニング手法の開発とクラウドコンピューティングへの応用
Project/Area Number |
24500178
|
Research Institution | Hiroshima City University |
Principal Investigator |
内田 智之 広島市立大学, 情報科学研究科, 准教授 (70264934)
|
Co-Investigator(Kenkyū-buntansha) |
正代 隆義 九州国際大学, 国際関係学部, 教授 (50226304)
宮原 哲浩 広島市立大学, 情報科学研究科, 准教授 (90209932)
|
Project Period (FY) |
2012-04-01 – 2015-03-31
|
Keywords | グラフアルゴリズム / データマイニング / 知識発見 / Webマイニング / クラウド・コンピューテイング / 機械学習 / 情報基礎 / 情報検索 |
Outline of Annual Research Achievements |
研究課題の目的は、Webページやマルチメディアデータの持つグラフ構造をはじめとする特徴を一体的に抽出する省メモリWebマイニング手法の開発を行い、クラウド・コンピューティングへの応用として、ユーザ・オリエンティッドな情報検索・提示システムを開発することである。最終年度となる26年度は、主として次の2テーマについて研究を行い、研究成果をまとめる作業を行った。 1) 省メモリオンラインWebマイニングシステムの開発:木構造をもつデータ(Webページなど)の特徴を表現できる順序項木パターンに対するパターンマッチングアルゴリズムと特徴的な順序項木パターンを過不足なく枚挙するアルゴリズムについて、簡潔データ構造を用いることで省メモリ・高速化を図ることができた。具体的には、2ノードからなる変数だけをもつ順序項木パターン(2ポート項木パターン)に対する簡潔データ構造表現を、2つ以上のノードからなる変数を有する順序項木パターン(多ポート項木パターン)に対する簡潔データ構造表現に拡張し、簡潔データ構造を用いた多ポート項木パターンに対するパターンマッチングアルゴリズムと頻出多ポート項木パターン枚挙アルゴリズムを提案し、プロトタイプを実装した。 2)クラウド・コンピューティングへの応用:上記研究テーマと協調して、簡潔データ構造を用いた2ポート項木パターン全出現位置獲得アルゴリズムの開発を行った。具体的には、2ポート項木パターンtの簡潔データ構造表現と順序木Tの簡潔データ表現が与えられた時、tとTがマッチする際にtの各葉がTのどの葉と対応するかを逐次的に返すアルゴリズムを簡潔データ構造を用いて開発した。これにより、サーバーで全出現位置を取得しクライアントに配信する情報検索・提示システムのプロトタイプを実装した。 研究期間内に公開できなかった成果については今後随時国際会議等で公表していく予定である。
|
Research Products
(7 results)