研究実績の概要 |
これまでは,カルマンフィルタを用いた予測手法により,球体形状のパーティクルのみの実時間追跡・予測・実時間投影が可能であったが,形状は単純な球体に限定されていた.これに対し,本研究では深層学習を用いることにより,任意の形状の物体の位置と姿勢を同時に予測することを試みた.具体的には,ジャグリングで用いるクラブを対象とし,クラブを空中に投げ上げる動画を入力とし,0.5秒後のクラブの位置と姿勢を出力とするような深層学習ネットワークを設計した.約900秒の映像を訓練用,90秒の映像を評価用とし,学習を行わせた.その結果,予測なし,カルマンフィルタによる予測あり,深層学習による予測あり,の場合で投影精度がそれぞれ,6.63%, 59.36%, 63.55%となり,深層学習による予測が最も精度が高いことが示された.本成果は,国際会議International Conference on Advanced Visual Interface (AVI2020)に採択され,発表を行った.
|