2014 Fiscal Year Annual Research Report
Project/Area Number |
25730127
|
Research Institution | Tokyo University of Science |
Principal Investigator |
安藤 晋 東京理科大学, 経営学部, 講師 (70401685)
|
Project Period (FY) |
2013-04-01 – 2015-03-31
|
Keywords | 巨大情報資源マイニング / 系列パターンインデクシング / 時間非均質性 |
Outline of Annual Research Achievements |
本研究課題は巨大事例集合に関する探索的解析基盤の構築を目的とし,様々なドメインの巨大事例集合に共通する非均質性・高速性に由来する問題を克服する手法の開発に取り組んだ.本年度は行動センシングにから得られる実世界データを具体的な対象とする成果を挙げた. まず,行動データにおける高速性に由来する問題として,隣接する値間の相関が強い系列構造により,一般的な判別モデルの利用が難しいという課題があった.本課題で系列テンプレートと呼ぶプリミティブパターンを用いた表現形式とインデクシング方法を開発し,距離センサデータを用いた系列データの教師付き学習の実験において,学習したモデルの可読性と判別性能を同時に向上するという困難な問題を改善できることを示した.上記の成果についてデータマイニング分野の国際会議において発表した他,和文誌(情報処理学会トランザクション・数理モデル化と問題解決)に採録された.さらに,行動データの非均質性としてパターンの時間的スケールの違いから,判別分析や異常検出が十分な効果を得らない点が課題となっていた.これに対し,われわれは平面切断法法による多スケールの特徴空間での最適化手法と,異常検出のためのクラスタを用いたメタ特徴空間生成方法を提案した.これにより,判別に要する時間の短縮や多スケールでの異常検出を可能にした.以上の成果についてデータマイニング・知識発見分野の英文誌2誌にて発表した.
|