2008 Fiscal Year Annual Research Report
階層的構造データからの特徴的パタン発見に関する研究
Project/Area Number |
19700146
|
Research Institution | Kobe University |
Principal Investigator |
尾崎 知伸 Kobe University, 自然科学系先端融研究環重点研究部, 助教 (40365458)
|
Keywords | データマイニング / 階層的構造データ / 半構造データマイニング |
Research Abstract |
アイテム集合に対する相互依存パターン(ハイパークリークパターン)の概念を構造データに拡張し, 構造データに対する新たな特徴的パターン発見アルゴリズム(1) MDOT及び(2) HSGを開発した. MDOTは, 木構造データを対象に, 強い依存関係にある構成要素のみからなるパターンを発見する. 一方HSGは, グラフデータを対象に, 強い相互依存関係を持つパターンの集合を発見する. これらのアルゴリズムは, パターン内部及びパターン間の相互依存関係に着目し, パターンの成り立ちやパターン間の関係を理解するためのヒントを同時に与えるものであり, 結果の理解容易性の向上に大きく寄与するものである. また, これらの技術を階層的構造データへ応用し, 特徴的パターン発見アルゴリズム(3)HFMG及び(4)CHPSSを開発した. HFMGは, 複合構造グラフ(複数の構造データからなる頂点を持つグラフデータ)を対象に, パターン中の各頂点内におけるパターンの依存性(内部依存性), 及び頂点間の依存性(外部依存性)を考慮することで, 強い依存性を有する頻出パターンのみを列挙する. 一方, GHPSSは, 複合グラフとは異なる種類の階層的構造データであるグラフの系列を対象に, 相互依存性が高い部分グラフ列を列挙する. これらのアルゴリズムは, 階層的構造データからの効率的な特徴的パターン発見を実現しており, 解釈が容易なパターンの獲得が達成されるとともに, 階層的構造データを対象とした更なる分析の基礎を与えるものであると考えられる.
|