研究課題/領域番号 |
19H01115
|
研究機関 | 東京大学 |
研究代表者 |
原田 達也 東京大学, 大学院情報理工学系研究科, 教授 (60345113)
|
研究期間 (年度) |
2019-04-01 – 2023-03-31
|
キーワード | 画像認識 / 機械学習 |
研究実績の概要 |
本研究の目的は,少数の教師情報しかない状況において,高精度な画像認識モデルを学習するアルゴリズムの構築である.生成モデルを利用することで,今まで観測されていないデータを生み出すことが可能となり,少量の教師信号のみでも高精度の予測モデルが構築できる可能性がある.
そこで本年度は,昨年度に引き続きノイズにロバストな生成モデルの学習手法の研究を進めた.生成モデルの一つとして敵対的生成ネットワーク(GAN)は,画像の再現性に優れているが,画像劣化があっても学習画像を忠実に再現することができるため,劣化した画像と同じような画像を生成する欠点を持つ.この問題を解決するために,画像の劣化パラメータ(ぼかしカーネルの種類,ノイズ量,品質係数の値など)を知らなくても,劣化画像から直接きれいな画像生成器を学習できる,ぼかし・ノイズ・圧縮に頑健な敵対的生成ネットワーク(BNCR-GAN)を提案した.
さらに,スパースな複数画像から学習する変形可能な多関節物体の新規三次元表現であるNeural Articulated Radiance Fieldを提案した.近年の三次元陰関数表現の進歩により,複雑な物体のモデルを学習することが可能となったが,姿勢を制御可能な多関節物体の表現を学習することが困難という問題を抱える.この問題の解決に向けて,各三次元点の輝度場を解くために,注目する点に最も関連性の高い物体部分の剛体変換のみを考慮することで,三次元多関節物体の陰関数表現の定式化を行った.提案手法は,微分可能なため姿勢情報が付与された教師画像から学習可能であり,オートエンコーダを用いることで,物体カテゴリの複数インスタンスに渡る外観の変化を学習することができる.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
本年度の目標の一つとして,ノイズにロバストな生成モデルの学習手法の構築をあげていた.実際に本年度は,ぼかし・ノイズ・圧縮に頑健な敵対的生成ネットワーク(BNCR-GAN)を提案し,目標を達成することができた.この成果は,コンピュータビジョンのトップ会議である Computer Vision and Pattern Recognition Conference (CVPR)に採択されている.また,もう一つの目標として,三次元物体のもつ多関節のような幾何学的な拘束条件も含めて制御可能な三次元生成モデルの学習手法の構築をあげていたが,スパースな複数画像から学習する変形可能な多関節物体の新規三次元表現であるNeural Articulated Radiance Fieldを提案し,目標を達成することができた.これもコンピュータビジョンのトップ会議である International Converence on Computer Vision (ICCV)に採択されている.さらに想定外の成果として,陰関数表現からリアルタイムに三次元メッシュを生成可能な手法も本年度提案することが出来た.これはロボットのトップ会議であるIEEE International Conference on Robotics and Automation (ICRA)に採択された.
|
今後の研究の推進方策 |
来年度は,本年度に引き続き少数画像からの制御可能な三次元表現モデルの学習手法に着目して研究を進める.少数画像から制御可能な三次元表現モデルが獲得できれば,今まで観測されていない物体の画像データの生成やデータ補完が可能となり,少量の教師信号のみでも高精度の予測モデルが構築できる可能性がある.本年度は,関節構造が既知で姿勢の教師データが与えられた場合に三次元表現モデルを学習できる手法を考案したが,来年度はこの制約を緩和した方法論を構築する.
さらに,少数画像から高精度な予測モデルを構築する手法の一つとして,知識転移によりターゲット領域の分類器学習に必要な教師ラベルの量を大幅に低減させるドメイン適応の問題に取り組み,より包括的で分類性能の高い方法論の構築を試みる.
|