研究実績の概要 |
本研究は、異種情報源からなるデータを統合的に解析するため、複雑なパターンの欠測データを補完できる統計手法や、多人数データを有効活用できる共通特徴量の構築法を開発する。本年度は、以下の4点に取り組んだ。第1に、欠測データを無視した推論で生じるバイアスの問題に対処するため、propensity scoreを用いたマッチング法の改良法を提案した(Uchihashi et al., 2016)。具体的は、propensity score推定において線形モデルのlogistic regressionの代わりに、非線形モデルのCNNを用いることで、欠測バイアスを軽減できることを示した。第2に、GPSなどの移動軌跡のデータベースではプライバシー保護の理由から一部の移動履歴を削除することがあるが、このような欠測データを処理するための群疎性正則化付テンソル分解を提案した(Murakami et al., 2017)。この手法は少数訓練サンプルにおいても移動パターンの個人特性を捉えることができる特徴量表現を与える。一方で、公開データ内の匿名化された移動履歴のユーザ同定性能が従来法より高まるため、プライバシー攻撃への対応策の必要度も増すことがわかった。第3に、異種情報源からなるライフログの長時間記録の中から、有用な情報を持つ時区間(key frame)を抽出するための機械学習法を開発した(Li et al., 2017)。一人称映像に加えて加速度データを活用することにより、日常行動に無関係なアーチファクト区間(frame)を除去することが可能となった。第4に、アイトラッカー、深度カメラ、加速度計、心電計測用ウェア、スマートフォン、位置推定用ビーコンからなるライフログシステムを構築し、延べ5名の被験者が日常行動を行った際の信号を記録し、予備的解析を行った。
|