2021 Fiscal Year Annual Research Report

物理的演繹モデルと帰納的深層学習の融合によるしなやかな画像理解

Research Project

Project/Area Number	21H04893
Research Institution	Kyoto University
Principal Investigator	西野恒京都大学, 情報学研究科, 教授 (60814754)
Project Period (FY)	2021-04-05 – 2026-03-31
Keywords	知能情報処理
Outline of Annual Research Achievements	今年度は、特に演繹モデルの帰納的学習による推定を実現すべく、任意の物体の精緻な3次元形状復元に注力した。本研究では、研究代表者が以前に導出した可逆ニューラルネットワークによって表現された反射特性を用いて、画像から任意の素材でできた物体の精緻な形状復元を実現した。既知ではあるが複雑な自然環境光の下で撮像された少数枚の画像から、はじめに各画像について法線方向を確率分布として復元し、これらの法線分布を特徴とした対応点探索をすべての入力画像について同時に行うことにより、反射特性と３次元形状の同時推定をおこなった。特に、損失関数をノンパラメトリックに表現し、その最適解を出力するネットワークを構成することにより、法線推定のための解析的な生成モデルと、求められた法線分布も用いた深層学習による対応点探索という、まさに演繹と帰納の境目のない統合を実現することにより、いままで不可能であったら複雑な反射特性を持つ物体の自然環境下での３次元形状復元を実現した。本研究成果は現在国際会議に論文投稿中である。さらに、人間の視線推定において、体の動きと目の動きの間に存在する生理学的連動（vestibulo ocular reflex）をニューラルネットワークによって帰納的に学習することにより、人の体の向きと頭の向きの変遷から視線を正確に推定する手法を導出した。これにより、監視カメラ等の遠くから撮像された映像から人の視線行動理解を実現でき、老人の見守りなどにおける人の意図理解のための基盤技術となる。さらに、自動運転において、偏光や近赤外光において異なる光学的特性を示す様々な実世界素材を帰納的学習によりモデル化することにより、車載カメラから各画素単位で素材認識できることを示した。本研究成果は自動運転に素材の理解を可能とするものであり、安全性に大きく寄与するものである。これらの研究成果は国際会議発表予定である。
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason 当初計画していた演繹モデルと帰納的学習の統合による任意の物体の精緻な3次元形状復元する手法の導出に成功し、その有効性を実データを用いて検証することができた。また、自動運転における素材認識および自由行動をおこなう人物の遠くからの視線行動推定に関し、同様に演繹モデルと帰納的学習の統合された手法の導出ならびにその有効性の検証をおこなえた。これらの研究成果により、計画通り順調に研究が進展していると判断する。
Strategy for Future Research Activity	本研究成果をもとに、さらに光源状況の推定も同様に解析的な生成モデルを仮定しつつ、帰納的学習によって、反射特性と３次元形状とともに同時推定できないか探る予定であり、これらの結果を加えて、今回の国際会議投稿論文を拡充し、国際論文誌に投稿予定である。さらに、当初計画通り、光学的分解の学習による最適化や反射と幾何の統合的表現の導出などの研究項目に取り掛かる予定である。

Research Products
(6 results)

All 2022 2021

All Journal Article (3 results) (of which Peer Reviewed: 3 results) Presentation (3 results) (of which Int'l Joint Research: 3 results)

[Journal Article] Invertible Neural BRDF for Object Inverse Rendering2021
- Author(s)
  Zhe Chen, Shohei Nobuhara, Ko Nishino
- Journal Title
  
  IEEE Transactions on Pattern Analysis and Machine Intelligence
  
  Volume: online first Pages: 1-16
- DOI
  10.1109/TPAMI.2021.3129537
- Peer Reviewed
[Journal Article] Human object interaction detection with missing objects2021
- Author(s)
  Kaen Kogashi, Yang Wu, Shohei Nobuhara, Ko Nishino
- Journal Title
  
  Image and Vision Computing
  
  Volume: 113 Pages: 1-9
- DOI
  10.1016/j.imavis.2021.104262
- Peer Reviewed
[Journal Article] Non-Rigid Shape From Water2021
- Author(s)
  Meng-Yu Jennifer Kuo , Ryo Kawahara , Shohei Nobuhara , Ko Nishino
- Journal Title
  
  IEEE Transactions on Pattern Analysis and Machine Intelligence
  
  Volume: 7(43) Pages: 2220-2232
- DOI
  10.1109/TPAMI.2021.3075450
- Peer Reviewed
[Presentation] Multimodal Material Segmentation2022
- Author(s)
  Yupeng Liang, Ryosuke Wakaki, Shohei Nobuhara, Ko Nishino
- Organizer
  IEEE/CVF Conference on Computer Vision and Pattern Recognition
- Int'l Joint Research
[Presentation] Dynamic 3D Gaze from Afar: Deep Gaze Estimation from Temporal Eye-Head-Body Coordination2022
- Author(s)
  Soma Nonaka, Shohei Nobuhara, Ko Nishino
- Organizer
  IEEE/CVF Conference on Computer Vision and Pattern Recognition
- Int'l Joint Research
[Presentation] Human-Object Interaction Detection with Missing Objects2021
- Author(s)
  Kaen Kogashi,Yang Wu, Shohei Nobuhara, Ko Nishino
- Organizer
  International Conference on Machine Vision Applications
- Int'l Joint Research

2021 Fiscal Year Annual Research Report

物理的演繹モデルと帰納的深層学習の融合によるしなやかな画像理解

Principal Investigator

西野 恒 京都大学, 情報学研究科, 教授 (60814754)

Current Status of Research Progress

Reason

Research Products

[Journal Article] Invertible Neural BRDF for Object Inverse Rendering2021

Author(s)

Journal Title

DOI

[Journal Article] Human object interaction detection with missing objects2021

Author(s)

Journal Title

DOI

[Journal Article] Non-Rigid Shape From Water2021

Author(s)

Journal Title

DOI

[Presentation] Multimodal Material Segmentation2022

Author(s)

Organizer

[Presentation] Dynamic 3D Gaze from Afar: Deep Gaze Estimation from Temporal Eye-Head-Body Coordination2022

Author(s)

Organizer

[Presentation] Human-Object Interaction Detection with Missing Objects2021

Author(s)

Organizer

西野恒京都大学, 情報学研究科, 教授 (60814754)