• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2021 Fiscal Year Annual Research Report

少数データからの高精度な画像認識アルゴリズムの構築に関する研究

Research Project

Project/Area Number 19H01115
Research InstitutionThe University of Tokyo

Principal Investigator

原田 達也  東京大学, 大学院情報理工学系研究科, 教授 (60345113)

Project Period (FY) 2019-04-01 – 2023-03-31
Keywords画像認識 / 機械学習
Outline of Annual Research Achievements

本研究の目的は,少数の教師情報しかない状況において,高精度な画像認識モデルを学習するアルゴリズムの構築である.生成モデルを利用することで,今まで観測されていないデータを生み出すことが可能となり,少量の教師信号のみでも高精度の予測モデルが構築できる可能性がある.

そこで本年度は,昨年度に引き続きノイズにロバストな生成モデルの学習手法の研究を進めた.生成モデルの一つとして敵対的生成ネットワーク(GAN)は,画像の再現性に優れているが,画像劣化があっても学習画像を忠実に再現することができるため,劣化した画像と同じような画像を生成する欠点を持つ.この問題を解決するために,画像の劣化パラメータ(ぼかしカーネルの種類,ノイズ量,品質係数の値など)を知らなくても,劣化画像から直接きれいな画像生成器を学習できる,ぼかし・ノイズ・圧縮に頑健な敵対的生成ネットワーク(BNCR-GAN)を提案した.

さらに,スパースな複数画像から学習する変形可能な多関節物体の新規三次元表現であるNeural Articulated Radiance Fieldを提案した.近年の三次元陰関数表現の進歩により,複雑な物体のモデルを学習することが可能となったが,姿勢を制御可能な多関節物体の表現を学習することが困難という問題を抱える.この問題の解決に向けて,各三次元点の輝度場を解くために,注目する点に最も関連性の高い物体部分の剛体変換のみを考慮することで,三次元多関節物体の陰関数表現の定式化を行った.提案手法は,微分可能なため姿勢情報が付与された教師画像から学習可能であり,オートエンコーダを用いることで,物体カテゴリの複数インスタンスに渡る外観の変化を学習することができる.

Current Status of Research Progress
Current Status of Research Progress

1: Research has progressed more than it was originally planned.

Reason

本年度の目標の一つとして,ノイズにロバストな生成モデルの学習手法の構築をあげていた.実際に本年度は,ぼかし・ノイズ・圧縮に頑健な敵対的生成ネットワーク(BNCR-GAN)を提案し,目標を達成することができた.この成果は,コンピュータビジョンのトップ会議である Computer Vision and Pattern Recognition Conference (CVPR)に採択されている.また,もう一つの目標として,三次元物体のもつ多関節のような幾何学的な拘束条件も含めて制御可能な三次元生成モデルの学習手法の構築をあげていたが,スパースな複数画像から学習する変形可能な多関節物体の新規三次元表現であるNeural Articulated Radiance Fieldを提案し,目標を達成することができた.これもコンピュータビジョンのトップ会議である International Converence on Computer Vision (ICCV)に採択されている.さらに想定外の成果として,陰関数表現からリアルタイムに三次元メッシュを生成可能な手法も本年度提案することが出来た.これはロボットのトップ会議であるIEEE International Conference on Robotics and Automation (ICRA)に採択された.

Strategy for Future Research Activity

来年度は,本年度に引き続き少数画像からの制御可能な三次元表現モデルの学習手法に着目して研究を進める.少数画像から制御可能な三次元表現モデルが獲得できれば,今まで観測されていない物体の画像データの生成やデータ補完が可能となり,少量の教師信号のみでも高精度の予測モデルが構築できる可能性がある.本年度は,関節構造が既知で姿勢の教師データが与えられた場合に三次元表現モデルを学習できる手法を考案したが,来年度はこの制約を緩和した方法論を構築する.

さらに,少数画像から高精度な予測モデルを構築する手法の一つとして,知識転移によりターゲット領域の分類器学習に必要な教師ラベルの量を大幅に低減させるドメイン適応の問題に取り組み,より包括的で分類性能の高い方法論の構築を試みる.

  • Research Products

    (5 results)

All 2021 Other

All Journal Article (4 results) (of which Int'l Joint Research: 1 results,  Peer Reviewed: 4 results,  Open Access: 4 results) Remarks (1 results)

  • [Journal Article] Neural Articulated Radiance Field2021

    • Author(s)
      Atsuhiro Noguchi, Xiao Sun, Stephen Lin, Tatsuya Harada
    • Journal Title

      International Conference on Computer Vision (ICCV)

      Volume: - Pages: 5762-5772

    • Peer Reviewed / Open Access / Int'l Joint Research
  • [Journal Article] Blur, Noise, and Compression Robust Generative Adversarial Networks2021

    • Author(s)
      Takuhiro Kaneko, Tatsuya Harada
    • Journal Title

      IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)

      Volume: - Pages: 13579-13589

    • Peer Reviewed / Open Access
  • [Journal Article] Hyperbolic Neural Networks++2021

    • Author(s)
      Ryohei Shimizu, Yusuke Mukuta, Tatsuya Harada
    • Journal Title

      International Conference on Learning Representations (ICLR)

      Volume: - Pages: -

    • Peer Reviewed / Open Access
  • [Journal Article] Real-Time Mesh Extraction from Implicit Functions via Direct Reconstruction of Decision Boundary2021

    • Author(s)
      Wataru Kawai, Yusuke Mukuta, Tatsuya Harada
    • Journal Title

      IEEE International Conference on Robotics and Automation (ICRA)

      Volume: - Pages: -

    • Peer Reviewed / Open Access
  • [Remarks] Tatsuya Harada

    • URL

      https://www.mi.t.u-tokyo.ac.jp/harada/

URL: 

Published: 2023-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi