Research Abstract |
本研究の目標は,互いに関連する複数のパターン発見タスクに効果的に対処するために,データとパターンの表現形式を自動的に変更する新しいデータマイニング手法を開発し,計算機システムとして実装して人工・実データでその有効性を示すことである.本年度は主に,昨年度開発した拡張MDL原理を用いる分類学習用マルチタスクデータマイニング手法,拡張コルモゴロフ複雑性に基づく情報量距離を用いるクラスタリング手法,マルチタスクデータマイニング用の次元縮退手法を国際発表し,討論などで得た知見を活かしてさらなる改良と実験を行った.拡張MADL原理を用いる分類学習用マルチタスクデータマイニング手法は,連携研究者である邵浩氏がSDM2011国際会議で発表し,その知見を活かして主に理論的解析を進めた.コルモゴロフ複上雑性に基づく情報量距離を用いるクラスタリング手法は,連携研究者であるグエンヒテアク氏がISMIS2011国際会議で発表し,その知見を活かして収束性の証明などを行った.マルチタスクデータマイニング用の次元縮退手法は,連携研究者である童彬氏が筆頭著者になってSDM2011国際会議で発表し,その知見を活かして主に評価実験を充実させた,それらの結果と前年度までの成果を併せ,拡張MDL原理と拡張コルモゴロフ複雑性という2種類の情報圧縮可能性を評価基準とするマルチタスクデータマイニングをほぼ確立し,分類学習,クラスタリング,ルール群発見,次元縮退などの各種タスクでの手法群の提案と,種々の人工データおよび実データを用いる実験によるそれらの実証を達成した.他に,役割に基づくコミュニティ発見,マルチ視点の異常値検出,圧縮可能性に基づく超平面型分類子のマルチタスク学習,圧縮可能性に基づくグラフノードの一般化クラスタリング,領域横断型の軌道データ分析などにおいても成果を挙げた.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
拡張MDL原理と拡張コルモゴロフ複雑性という2種類の情報圧縮可能性を評価基準とするマルチタスクデータマイニングをほぼ確立し,分類学習,クラスタリング,ルール群発見,次元縮退などの各種タスクでの手法群の提案と,種々の人工データおよび実データを用いる実験によるそれらの実証を達成した.
|
Strategy for Future Research Activity |
残されたのは最終年度1年間であるが,引き続き拡張MDL原理と拡張コルモゴロフ複雑性という2種類の情報圧縮可能性を評価基準とするマルチタスクデータマイニングに取り組み,分類学習,クラスタリング,ルール群発見,次元縮退などの各種タスクでの手法群の提案と,種々の人工データおよび実データを用いる実験によるそれらの実証を進める.
|