2011 Fiscal Year Annual Research Report
不可逆圧縮原理に基づく非IIDデータ学習手法に関する研究
Project/Area Number |
22500119
|
Research Institution | Gunma University |
Principal Investigator |
安藤 晋 群馬大学, 大学院・工学研究科, 助教 (70401685)
|
Keywords | 機械学習 / アルゴリズム / 人工知能 / ソフトコンピューティング / データストレージ |
Research Abstract |
平成23年度の課題実施にあたり実用的なアプリケーションで扱われることが多い軌跡データを非均質データのベンチマークとして重点的に取り上げて行動理解の観点から解析を行った.研究目的において列挙した三つのデータ構造クラスの中で,第一の連続的にクラス構造の変化する非均質データとして多粒度データマイニング問題を定義し,アンサンブル学習に基づく異常検出の方法論を示した.また,第二のクラス構造が離散的に異なる非均質データとしてコンテクスト依存行動検出問題を定義した.これは行動の役割や目的をコンテクストとみなし,特定の役割でしか見られない行動を検出することを目的とし,行動の意味理解の重要な問題である.従来手法ではロバストに扱うことは難しかった.この問題を異常検出問題を特殊ケースとして,すなわち,異常検出はクラスタ構造の差異が異常行動のクラスタである場合として含むよう一般的に定義した.二つのデータ構造クラスを扱うための基礎手法として近傍距離サンプルを用いた近似密度比較の方法を定義し,それぞれの行動分析の目的にあわせて効率的な実装を設計した.従来の密度ベース手法よりも効率的であり,仮説生成や役割の判別にも役立つことを実験的に示した.これらの成果についてともにトップレベルの国際会議(SDM11,ICDM11)で発表し,さらに実験と議論を追加して英論文誌に投稿した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初に挙げた3つの非均質データ構造クラスのうち2つについて実データの解析が完了し,データマイニング問題を扱う上で基礎となる近似密度比較手法を開発・検証するという目的を達成している.
|
Strategy for Future Research Activity |
人間行動データに拡張.行動クラスタラベルをより実用的な仮説生成に利用することを目指す.グラフマイニング手法であるスペクトル表現手法を基礎に方法論を構築することを検討する.同時に,3系列以上の時系列情報源を扱えるように拡張する.異粒度時系列データからの学習の知見を活かし,早期分類といった教師付き学習の方法を検討する.実応用として医療診断,GPS測地変位からの異常検出に取り組む.軌跡データと脳電位データのように外観測と内部状態を反映するような本質的に異なる情報を表す情報源から知識抽出の方法について検討する.
|