2009 Fiscal Year Annual Research Report
動的表現バイアスに基づくマルチタスクデータマイニング
Project/Area Number |
21300053
|
Research Institution | Kyushu University |
Principal Investigator |
鈴木 英之進 Kyushu University, 大学院・システム情報科学研究院, 教授 (10251638)
|
Keywords | 動的表現バイアス / マルチタスクデータマイニング / 分類学習 / ルール発見 / 分類学習 / クラスタリング |
Research Abstract |
本研究の目標は,互いに関連する複数のパターン発見タスクに効果的に対処するために,データとパターンの表現形式を自動的に変更する新しいデータマイニング手法を開発し,計算機システムとして実装して人工・実データでその有効性を示すことである.本年度は,主に拡張MDL原理を用いたルール群発見手法/選言標準形概念の分類学習手法を開発し,多数の人工データに適用してその性能を調べた.はじめに,代表者が過去に提案した互いに関連しあうルール群発見手法用の拡張MDL原理を,2値属性データマルチタスクデータマイニング用に拡張した.この拡張では,複数のデータマイニングタスクが共通の符号表を持ち,この符号表には共通すると推定される部分概念が保存される.次に,この符号表を逐次的に更新することにより,データ・仮説の表現形式を変更する探索法を開発した.人工データを用いた実験結果は良好であり,広い範囲の問題設定において,データ欠如やノイズに対する頑健性を示すことができた.その他,コルモゴロフ複雑性に基づく情報量距離を用いたクラスタリング・分類学習およびテキストやグラフデータからのデータマイニング手法の開発にも取り組んだ.前者では主に階層型クラスタリングを対象とし,有望な結果を得た.後者では例外的だが興味深いパターンを発見する問題を対象とし,データ構造とアルゴリズムに特に注力して高速なデータマイニング手法を開発し,人工・実データに適用して有効性を確認した.
|