本研究の目的は,少数の教師情報しかない状況において,高精度な画像認識モデルを学習するアルゴリズムの構築である.生成モデルを利用することで,今まで観測されていないデータを生み出すことが可能となり,少量の教師信号のみでも高精度の予測モデルが構築できる可能性がある.
昨年度は,関節構造が既知で姿勢の教師データが与えられた場合に三次元表現モデルを学習できる手法を考案したが,本年度はこの制約を緩和した方法論の構築や時間的に変形する非剛体物体の再構築問題に取り組んだ.具体的には,関節のアノテーションや構造に関する情報などの教師情報を必要とせず,複数視点から対象物体の動きを観察することにより,未知の多関節物体のアピアランスと構造の両方を学習するWatch It Moveと呼ばれる新規手法を構築した.また,非剛体物体の時空間再構築を目指して,非剛体点群のレジストレーション手法の開発を行った.未知対象物体の非剛体運動は複雑性が非常に高いため,困難な問題であることが知られている.そこでこの問題を解決するために,複雑な動きを階層的に分解するNeural Deformation Pyramid (NDP)と呼ばれる新規の方法論を提案し,既存のMLPベースのアプローチと比較して,より高い精度を保ちながら50倍高速化することに成功した.
さらに,知識転移により対象ドメインの教師ラベル量を低減させることを目的として,教師なしドメイン適応(UDA)問題にも取り組んだ.従来の敵対的な学習を利用したUDA手法は,ドメイン分類器とラベル分類器を別々に学習することが多く,両分類器は互いにほとんど相互作用しない状況であった.我々はこの二つの分類器を相互作用させることによって,ドメイン分類器がラベルの判別に重要な特徴により焦点を当てるように訓練させることに成功し,UDAの性能向上を実現した.
|