研究課題/領域番号 |
20K19836
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分61010:知覚情報処理関連
|
研究機関 | 国立研究開発法人産業技術総合研究所 |
研究代表者 |
吉安 祐介 国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (10712234)
|
研究期間 (年度) |
2020-04-01 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2021年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
2020年度: 2,470千円 (直接経費: 1,900千円、間接経費: 570千円)
|
キーワード | 深層学習 / 自己教師学習 / 体型 / 3Dポーズ / 機械学習 / 人体三次元形状 / 人体三次元姿勢 / 身体姿勢 / 姿勢 / 3次元 |
研究開始時の研究の概要 |
深層学習により画像認識の分野は目覚しい発展を遂げ、大規模データを用いて学習を行うことで認識精度が飛躍的に向上した。一方、人の身体3次元認識おいては、姿勢や体型などの3次元情報をラベル付けした大規模な画像データセットを構築することが難しく、画像分類や2Dポーズ認識と比較して十分な精度や汎用性を発揮するに至っていない。そこで、本研究課題では、人の体型と姿勢の3D学習に要するラベリング作業を軽減する自己教示学習について研究する。
|
研究成果の概要 |
本研究では、単眼画像から人の体型と姿勢の三次元推定を行う課題において、これまでボトルネックとなっていた画像に対して3D体型姿勢情報を付与する労力を軽減する自己教示学習について研究した。まず、研究分野で活用されている人間の画像と3Dデータセットを収集・準備し、トランスフォーマを用いた3D体型・ポーズ推定モデルの構築を行った。その上で、3Dラベルの使用を軽減する①Masked autoencoder (MAE)という自己教示学習手法で学習した画像特徴抽出器を用いる方法、②2D画像と3Dモデルの密な対応付け情報を用いる学習方法と③三次元形状生成モデルを用いる方法を開発した。
|
研究成果の学術的意義や社会的意義 |
開発したトランスフォーマを用いた3D体型・ポーズ推定モデルは、ベンチマークにおいて高い性能を示し、コンピュータビジョン分野のトップ国際会議CVPR2023にも採録されており、学術的な意義が高い。また、MAEという自己教示学習を用いる方法、2D-3D間の密な対応付け情報を用いる方法、三次元生成モデルを用いる方法は学習に必要となる3Dラベルを軽減するという点で有用である。
|