2010 Fiscal Year Annual Research Report
グラフパターン言語の計算論的学習理論とグラフマイニングへの応用
Project/Area Number |
20500016
|
Research Institution | Kyushu University |
Principal Investigator |
正代 隆義 九州大学, 大学院・システム情報科学研究院, 准教授 (50226304)
|
Co-Investigator(Kenkyū-buntansha) |
内田 智之 広島市立大学, 情報科学研究科, 准教授 (70264934)
|
Keywords | グラフパターン / グラフ言語 / グラフアルゴリズム / グラフ構造データ / データマイニング / 機械学習 / 機械発見 / 帰納推論 |
Research Abstract |
本研究課題の目的は、グラフ構造データベースに蓄積された膨大な情報から役に立つ科学的知識を学習するための理論構築とグラフマイニングシステム開発である。平成22年度は、これまで得られた研究成果の基礎理論の確立、および実データに対する構造パターン発見の実証を行った。 与えられたグラフデータに、指定されたグラフパターンが現れるか否かを問う問題は、グラフマイニングにおける最も基本的な問題である。これをグラフパターン照合問題と呼ぶ。グラフパターンとは、適当な条件下で任意のグラフと置き換え可能な内部変数を持つグラフ構造を指す。これまでに本課題では、化学化合物のデータベースに対して、グラフパターン照合問題などのグラフマイニングにおける基本的な問題に効率の良いアルゴリズムを与え、興味深いグラフパターンの抽出に成功してきた。平成22年度は、グラフパターンの一般化を目的とし、グラフの木幅を考慮したグラフパターンを提案し、そのグラフパターン照合問題に対するアルゴリズムを提案した。実際、化学化合物のほとんど全てが小さい木幅のグラフで表現できることが知られており、本結果により化学化合物のほとんど全てを効率の良いグラフパターンマイニングの対象とすることができる。 次に、パターン発見アルゴリズムの効果的な利用として、ダークネットで観測されたデータのスクリーニング手法を提案した。インターネットにおける脅威の一つとしてボットネットなどによる不正アクセスがある。その脅威を早期に検知するためには、ダークネットなどのネットワーク観測による脅威の傾向把握が必要である。本課題では、脅威の傾向を明確にするために、ありふれた不正パケット群を、頻出時系列パターン発見によって取り除くデータスクリーニング手法を提案し、実データに対して満足すべき効果が得られることを確認した。 以上が、本年度に得た研究成果の概要である。
|
Research Products
(11 results)