研究概要 |
平成23年度の課題実施にあたり実用的なアプリケーションで扱われることが多い軌跡データを非均質データのベンチマークとして重点的に取り上げて行動理解の観点から解析を行った.研究目的において列挙した三つのデータ構造クラスの中で,第一の連続的にクラス構造の変化する非均質データとして多粒度データマイニング問題を定義し,アンサンブル学習に基づく異常検出の方法論を示した.また,第二のクラス構造が離散的に異なる非均質データとしてコンテクスト依存行動検出問題を定義した.これは行動の役割や目的をコンテクストとみなし,特定の役割でしか見られない行動を検出することを目的とし,行動の意味理解の重要な問題である.従来手法ではロバストに扱うことは難しかった.この問題を異常検出問題を特殊ケースとして,すなわち,異常検出はクラスタ構造の差異が異常行動のクラスタである場合として含むよう一般的に定義した.二つのデータ構造クラスを扱うための基礎手法として近傍距離サンプルを用いた近似密度比較の方法を定義し,それぞれの行動分析の目的にあわせて効率的な実装を設計した.従来の密度ベース手法よりも効率的であり,仮説生成や役割の判別にも役立つことを実験的に示した.これらの成果についてともにトップレベルの国際会議(SDM11,ICDM11)で発表し,さらに実験と議論を追加して英論文誌に投稿した.
|
今後の研究の推進方策 |
人間行動データに拡張.行動クラスタラベルをより実用的な仮説生成に利用することを目指す.グラフマイニング手法であるスペクトル表現手法を基礎に方法論を構築することを検討する.同時に,3系列以上の時系列情報源を扱えるように拡張する.異粒度時系列データからの学習の知見を活かし,早期分類といった教師付き学習の方法を検討する.実応用として医療診断,GPS測地変位からの異常検出に取り組む.軌跡データと脳電位データのように外観測と内部状態を反映するような本質的に異なる情報を表す情報源から知識抽出の方法について検討する.
|