研究課題/領域番号 |
23700271
|
研究機関 | 九州工業大学 |
研究代表者 |
堀尾 恵一 九州工業大学, 生命体工学研究科(研究院), 准教授 (70363413)
|
研究期間 (年度) |
2011-04-28 – 2013-03-31
|
キーワード | ジェスチャ認識 / 時空間パターン / 特徴空間 / マニフォールド / マニフォールド学習 |
研究概要 |
本研究の目的は,ジェスチャの認識であり,具体的には,動画像から手首より先の部分を抽出,追跡し,その形状の時間変化から動作の意味を認識することである.2年間の研究予定の1年目である平成23年度は,(1)対象の追跡,(2)対象を表現する特徴量の検討,(3)ジェスチャをマニフォールドで表現する際の表現方法,について検討を行った.(1)パーティクルフィルタと呼ばれる手法を用いて対象の追跡を試みた.ジェスチャの場合は,対象が高速かつ複雑に移動する場合も多く,通常のパーティクルフィルタでは,高精度で追跡することができない場合が多々あった.本研究では,対象の動きをモデル化してパーティクルに埋め込む手法を採用しているが,様々な動きを想定したモデルをパーティクルに埋め込み,異なるモデルが混合したパーティクルフィルタを提案した.シミュレーションにより,高速移動や急激な方向変化にも従来手法と比較して頑健に追跡できることを確認した.(2)対象である手首より先の画像に対して,認識に適した特徴量について検討した.従来から認識問題でよく用いられているSIFTやHOGと呼ばれる特徴量について検討したが,この問題の場合,SIFTでは対象の形状が表現されていないこと,HOGでは,対象の回転や並行移動に対応できないこと,があり,良好な認識結果を得ることができなかった.現在,SIFTとHOGのそれぞれの特長を活用した新しい特徴量について検討を行っている.(3)マニフォールドの表現方法として,まず,データ点の集合体として表現する方法を検討したが,データ点に疎密があり,適切な表現はできなかった.混合ガウス分布を用いることで各マニフォールドを適切に表現することができた.現在,マニフォールド間の距離系を定義を検討している.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究の目的は,ジェスチャの認識であり,動画像中の手首より先の部分を追跡し,その形状の時間変化から動作の意味を認識することである.平成23年度は以下を中心に研究を行った.(1)画像の前処理手法の検討においては,対称物体(ここでは手)の追跡に関して研究を行った.具体的には,パーティクルフィルタを用いて,動画像中に含まれる肌色を高精度で追跡することを目的として,異なる特性を有するパーティクルを混在させる手法を提案し,高速かつ不規則な動きをする対象を高精度で追跡できることを確認した.(2)特徴抽出の検討においては,これまで画像認識で一般的に用いられているSIFTやHOGなどの特徴量について検討を行った.SIFTは対象の回転や並行移動には頑健であるが,形状の表現が適切に行えないこと,一方,HOGは,対象の形状を表現できるが,回転にに対する頑健性が弱いことがあり,個別の方法ではジェスチャ認識の特徴量として利用することは不十分であることを示した.(3)対象形状の時間変化をマニフォールドとして表現することで,時間伸縮に頑健な認識手法を目指している.これまでは,マニフォールドを各時刻の特徴量の集合として取り扱ってきたが,データ分布の疎密がある場合良好な結果を得ることができなかったので,混合ガウス分布で表現することを検討した.
|
今後の研究の推進方策 |
まず,昨年度に進めた研究で不十分であった以下の点について集中的に検討を行う.(1)特徴抽出において,SIFTとHOGのそれぞれの特長を利用した新しい特徴量を検討する.それにより,対象の並行移動や回転に頑健でかつ対象の形状を適切に表現できる特徴量を提案することを目的とする.(2)マニフォールドの表現方法として,混合ガウス分布をより詳細に検証する.混合ガウス分布により表現方法は,データ点の集合での表現方法と比較して,複数のマニフォールド間の距離を定義しやすい点が特長である.しかしながら,昨年度はマニフォールド間の距離に関する検討を行っていないので,今年度は,それを検討することを目的とする.次に,研究開始当初の計画である以下の項目を実施する.(3)マニフォールド間の距離系の検討については,(2)で各マニフォールドを混合ガウス分布で表現することを検討するので,Kullbuck-Leibler情報量を用いることが適切であると考えられる.しかし,データ点の分布に偏りが大きい場合など,適切なKullbuck-Leibler情報量が得られないと考えられるので,必要に応じて混合ガウス分布の改善を行う.(4)上記の要素技術を見直し,ジェスチャ認識システムを構築する.その際,各要素技術間の調整が必要となる.また,動画像を対象としているので,毎秒30フレームの処理速度の実現を目指す.背景や照明条件のことなる環境下でシミュレーションを行い,性能の検証を行う.
|
次年度の研究費の使用計画 |
平成24年度に予定していた研究打合せを行うことができず,本年度に研究費を繰り越している.予定していた研究打合せを本年度に行う.また,今年度は,高速演算用のパソコンを購入する.また,研究打合せや成果発表のための旅費,論文投稿料,データ取得や整理のための謝金を支払う予定である.
|