2002 Fiscal Year Annual Research Report
確率モデルの学習に基づいた、単眼画像列からの人体の姿勢復元
Project/Area Number |
14580427
|
Research Institution | Hiroshima City University |
Principal Investigator |
林 朗 広島市立大学, 情報科学部・情報機械システム工学科, 教授 (60240909)
|
Co-Investigator(Kenkyū-buntansha) |
岡田 正巳 東京都立大学, 理学研究科, 教授 (00152314)
神原 利彦 広島市立大学, 情報科学部・情報機械システム工学科, 助手 (60285426)
末松 伸朗 広島市立大学, 情報科学部・情報機械システム工学科, 助教授 (70264942)
|
Keywords | 姿勢の推定 / 人間の動き / コンピューター・ビジョン / 機械学習 / 多様体学習 / モーション・キャプチャー |
Research Abstract |
本研究では単眼画像列から人体の姿勢の推定を試みている。あらかじめ用意した人体モデルを利用して姿勢を推定する研究は多いが、我々は人体モデルの不要な、確率的モデルの学習アプローチを採用する。モーション・キャプチャのデータを教師データとして、姿勢と画像との関係を学習する。 学習から姿勢を推定するには、異なる姿勢が視点によっては良く似た画像を与えるという曖昧さなど、多くの困難がある。我々は、画像平面に投影したマーカーの2次元座標からなるベクトルで姿勢を表現し、これらの問題点を次のように解決する。(1)画像から姿勢は一対多写像であり、関数学習の枠組みに乗らない。これを画像特徴と姿勢の直積空間内の多様体の学習問題と考える。(2)複数の姿勢候補に対して、ベイズ推論を用い、事後確率の高い姿勢を解とする。(3)一枚の画像からではなく、画像列から姿勢を推定する。その際、速度の連続性条件を満たす姿勢系列を解とする。 提案手法の実装を行い、実験を行った結果、次のような問題点があることがわかった。(1)推定された姿勢の精度が低い、(2)速度の連続性の条件のモデル化が難しい、(3)姿勢を推定する際の証拠となる、観測された画像特徴と、速度の連続性との重み付けが難しい、(4)画像姿勢多様体の学習に大量の教師データが必要である、(5)現在のアルゴリズムでは姿勢の初期値を与えなければならない。 上記問題点の解決方法として、(1)隠れマルコフなどの動的モデルを学習する、(2)より少ない教師データから学習可能な画像姿勢多様体表現(たとえば、パラメータ曲線+ガウス雑音モデル)を用いる、などを検討中である。また、これまではCGで合成した画像列を用いて実験してきたが、今後実画像を用いた実験にも取り組みたい。
|
Research Products
(1 results)