研究概要 |
非均質データを扱う問題設定として本課題では自己学習(Self-taught Learning)を取り上げた.これは非均質な追加(Auxiliary)データを利用して特徴生成の効果を向上する問題である.われわれはクラスタリング構造を特徴空間への射影において維持する枠組みを構築した.テキストドメインと協調フィルタリング(レーティング)データにおいて生成した特徴量と探索的解析や分類問題での性能に関する定量的な評価を行い,その成果発表の準備として国際会議ECMLに投稿した. ロボットの軌跡データについては時間的粒度の異なるデータからの学習結果を統合するアンサンブル手法を提案し,半教師付きの異常検出問題に適用した.その成果はSDM(SIAMデータマイニング)および複数国内の研究会で発表した.
|