本研究では,『行動解析・推定システムへの応用を念頭に,シンプルなデータで構成されるビックデータに対し,最適化技術により,複雑なデータ処理を自動生成するフレームワークを確立する』ことを主な目的としている. モーションキャプチャや運動解析などの技術に応用や,既存の多くの姿勢推定手法における3Dポーズの推定精度の向上を念頭に,本研究では人物の姿勢推定の研究に取り組んでいる.また,複雑となるデータ処理をパラメータで表し,行動解析や行動推定システムそのものの最適化を考慮しており,最終的に扱うデータとして,シンプルなマルチメディアデータで構成されるビッグデータとする.そのため,一昨年度から,3D人物姿勢のスケルトンを用いた人間姿勢の検索および,2Dランドマークからの3D人物姿勢推定における奥行き曖昧さと呼ばれる問題の解決に取り組んでいる.また、昨年度は昨年度の研究成果をさらに発展させ,従来の色、形状、テクスチャではなく、人間の姿勢によって定義される視覚的な類似性に基づいた手法を提案し,ジャーナル論文として国際的な学術誌に掲載された. 本年度は、行動解析・推定システムの一部として,音声や画像のように,まったく性質の異なるデータを扱う機械学習のフレームワークの研究に取り組んだ.異なるトレーニングデータをどのように組み合わせて学習するかなどに関して検討し,いくつかの深層学習のネットワーク構造を提案し、標準データセットにより評価した。さらに、転送学習が性能を飛躍的に向上させることが判明した。これらの結果をジャーナル論文で発表した. 本申請は,2016年度 第8回 国際共同研究加速基金(16KK0069)の基課題となっており,本年度の成果の一部は,岩手大学で製作した装置を用いて,カリフォルニア工科大学における行動心理実験を通じて,新たな知見や実験結果のフィードバックによって得られている.
|