2005 Fiscal Year Annual Research Report
複雑な知識構造を有すデータからの有意属性の帰納的構築手法の開発
Project/Area Number |
16300046
|
Research Institution | Osaka University |
Principal Investigator |
元田 浩 大阪大学, 産業科学研究所, 教授 (00283804)
|
Co-Investigator(Kenkyū-buntansha) |
鷲尾 隆 大阪大学, 産業科学研究所, 助教授 (00192815)
吉田 哲也 北海道大学, 大学院情報科学研究科, 助教授 (80294164)
大原 剛三 大阪大学, 産業科学研究所, 助手 (30294127)
|
Keywords | 機械学習 / 知識発見 / データマイニング / クラスタリング / グラフマイニング / 時系列解析 / 属性構築 |
Research Abstract |
研究実績は以下のとおり. 1.平成16年度に開発した仮想チャンキングを用いた逐次ペアチャンキングを特徴とするCl-GBIを仮想チャンクしない従来のB-GBIと比較し,実際に重なりのある部分グラフをCl-GBIは正しく抽出できることを確認した.また,部分グラフの包含関係の単調性を利用している他のグラフマイニング手法出は抽出できない部分グラフを抽出できることも確認した.これにより,C-GBI法の有意性を確認した. 2.Cl-GBI法の逐次ペアの選択に制約を加え,連結部分グラフの下位概念である連結パスのみを探索することもできるようにした.これにより一層の高速化を達成した. 3.平成16年度に開発した部分構造の逐次抽出機能をオンライン属性構築に用いた決定木構築手法DT-ClGBIを多種のグラフ構造データに適用し,再帰呼び出しによる属性構築の効果を定量的に評価し,必要な改良を加えた.グラフの特徴によって性能が変化するため,グラフの大きさ,ノード数,ノード当たりのリンク数,クラスに特徴的な埋めこみパタンをパラメータとして系統的な評価実験を実施し,事前に全ての部分グラフを探索する手法に比較して効率よく最適な部分グラフを探索できることを確認した. 4.Cl-GBIの逐次ペアの生成順序と上位ペアの選択規準を制御することにより,人工データ,実データ(肝炎データ)ともに,少ない探索数で同一分離能力を有する部分グラフを発見できることを確認した. 5.Cl-GBIで探索する部分グラフに,1)指定した部分グラフを必ず含むものを探索する,2)指定した部分グラフを含まないもののみを探索する,という2種類の制約をあらたに追加した. 6.以上を,汎用のグラフマイニングシステムとしてまとめ,成果を公開した.
|