人間の高次視覚は、見ているものを認識し、その物理的構成等を復元するという二つの重要な機能を備えており、これらの機能が密接に連携することにより、豊かな視覚知能を実現している。一方、コンピュータビジョンにおいて実世界の認識と復元は、互いに独立してその機能の実現が追究されてきた。本研究では、認識と復元を統合することにより、それぞれの現在の本質的限界を突破し、より精確で豊かな計算機視覚知能の実現を目指している。画像に写されたものを認識することによりそれらの復元が精緻になり、逆にその物理的構造や特性を明示的に復元することにより認識がより精確になるよう、両者の有機的統合を、統計的機械学習にもとづいた見通しの良い定式化と効率的な推定手法の導出により実現することを目指している。交付二年目となる令和元年度は平成30年度の研究成果に基づき、特に深層学習生成モデルを用いた新たな反射特性モデル、単一画像からの反射特性と光源状況の復元、主に水中を含む物体のより精確な3次元幾何形状の復元手法、ならびに水面反射による形状復元手法の導出を行い、これら研究成果の国際会議投稿と発表をおこなった。
|