2023 Fiscal Year Annual Research Report
Research on a Multi-modal Registration Model for Video Matching and Its Advanced Applications
Project/Area Number |
20H00607
|
Research Institution | Osaka University |
Principal Investigator |
槇原 靖 大阪大学, 産業科学研究所, 教授 (90403005)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Keywords | コンピュータビジョン / パターン認識 / バイオメトリクス |
Outline of Annual Research Achievements |
P1) 解きほぐし表現学習による空間・時間・色の多元位置合わせモデル P1-3) 解きほぐし表現を利用したデータ拡張 画像認識で頻繁に用いられる並進やスケーリングといった単純なデータ拡張とは異なり、解きほぐし表現によるデータ拡張は、空間や時間といった要素を考慮して学習サンプルを拡張できる点が優れている。 具体例として、対象物体が世界座標系において等速度運動するという仮定に基づいて、画像座標系上で対象物体の外接矩形列が、開始フレームと終了フレームの外接矩形からの非線形な補間によって表現されることを示し、そのような等速度運動に基づく外接矩形列をデータ拡張する手法を提案した。また、その外接矩形列によるクリッピング映像に基づいて映像照合モデルを学習する枠組みを構築した。10,000名以上を含む歩行映像データベースOUMVLPを用いて、モデルベース歩容認証手法であるModelGaitと、アピアランスベース歩容認証の最新手法であるGaitBaseに対して、本手法の有無による精度評価実験を実施し、本手法の有効性を確認した。 また、対象物体の一部が遮蔽された条件下での映像照合の問題設定に対して、時間軸方向については位置合わせした上で、空間方向の位置合わせずれを模した外接矩形をデータ拡張し、クリッピング映像に対して照合するモデルを開発した。アピアランスベース歩容認証手法であるGaitSetに対して提案手法の有無による精度評価実験を通して、同手法の有効性を確認した。
|
Research Progress Status |
令和5年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
令和5年度が最終年度であるため、記入しない。
|