研究課題
研究課題の目的は、Webページやマルチメディアデータの持つグラフ構造をはじめとする特徴を一体的に抽出する省メモリWebマイニング手法の開発を行い、クラウド・コンピューティングへの応用として、ユーザ・オリエンティッドな情報検索・提示システムを開発することである。最終年度となる26年度は、主として次の2テーマについて研究を行い、研究成果をまとめる作業を行った。1) 省メモリオンラインWebマイニングシステムの開発:木構造をもつデータ(Webページなど)の特徴を表現できる順序項木パターンに対するパターンマッチングアルゴリズムと特徴的な順序項木パターンを過不足なく枚挙するアルゴリズムについて、簡潔データ構造を用いることで省メモリ・高速化を図ることができた。具体的には、2ノードからなる変数だけをもつ順序項木パターン(2ポート項木パターン)に対する簡潔データ構造表現を、2つ以上のノードからなる変数を有する順序項木パターン(多ポート項木パターン)に対する簡潔データ構造表現に拡張し、簡潔データ構造を用いた多ポート項木パターンに対するパターンマッチングアルゴリズムと頻出多ポート項木パターン枚挙アルゴリズムを提案し、プロトタイプを実装した。2)クラウド・コンピューティングへの応用:上記研究テーマと協調して、簡潔データ構造を用いた2ポート項木パターン全出現位置獲得アルゴリズムの開発を行った。具体的には、2ポート項木パターンtの簡潔データ構造表現と順序木Tの簡潔データ表現が与えられた時、tとTがマッチする際にtの各葉がTのどの葉と対応するかを逐次的に返すアルゴリズムを簡潔データ構造を用いて開発した。これにより、サーバーで全出現位置を取得しクライアントに配信する情報検索・提示システムのプロトタイプを実装した。研究期間内に公開できなかった成果については今後随時国際会議等で公表していく予定である。
すべて 2015 2014
すべて 雑誌論文 (4件) (うち査読あり 4件、 謝辞記載あり 1件) 学会発表 (3件)
IEICE TRANS. FUNDAMENTALS
巻: E98-A, NO.6 ページ: -
Applied Computing and Information Technology, Springer, Studies in Computational Intelligence
巻: 553 ページ: 77-90
10.1007/978-3-319-05717-0_6
Latest Advances in Inductive Logic Programming, Imperial College Press
巻: - ページ: 173-180
10.1142/9781783265091_0018
Proc. IWCIA2014, 2014 IEEE 7th International Workshop on Computational Intelligence and Applications
巻: - ページ: 113-118
10.1109/IWCIA.2014.6988088