• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2018 Fiscal Year Annual Research Report

画像と言語を用いた質感情報表現のディープラーニング

Planned Research

Project AreaUnderstanding human recognition of material properties for innovation in SHITSUKAN science and technology
Project/Area Number 15H05919
Research InstitutionTohoku University

Principal Investigator

岡谷 貴之  東北大学, 情報科学研究科, 教授 (00312637)

Co-Investigator(Kenkyū-buntansha) 川嵜 圭祐  新潟大学, 医歯学系, 准教授 (60511178)
Project Period (FY) 2015-06-29 – 2020-03-31
Keywords深層学習 / コンピュータビジョン / 質感認識 / 画像復元 / 画像と言語の融合タスク
Outline of Annual Research Achievements

研究計画に従い,質感認識システムの実現にむけて多方面から取り組み,以下の成果を得た.
CNNと人の視覚機能の振る舞いの違いの一つに,ノイズ等の画質劣化への耐性がある.これに対しわれわれは,画質劣化に対し,本質的な耐性を向上させるCNNの構造を研究し,活性化関数に手を加えることで性能を向上させられることを発見し,国際会議CVPR2018にて発表した.さらに,劣化した画質を改善する画像復元の研究を行い,いくつかの成果を得た.画像復元タスクを対象としたネットワーク構造の自動設計手法を世界で初めて開発,その効果を確認し,国際会議ICML2018にて公表した.その後の研究により,画質劣化に対し強力な性能を発揮するCNNの構造(双残差結合)を考案し,これが多様な劣化要因(ガウス性ノイズ,雨筋,雨滴,JPEG圧縮ノイズ,モーションブラー,霧・霞)を対象に,それぞれに細部構造を最適化することで,世界最高水準の性能を達成した.この方法は,入力画像が含む劣化要因が特定できない場合には使えない.そこで,その場合に,画像を復元可能な方法を開発している.以上の方法はともに,国際会議CVPR2019に採択されている.
画像から認識した質感は,最終的には人に理解可能な言語情報として表現・出力する必要がある.画像と言語の間のクロスモーダルな情報統合を,注意(アテンション)を軸に実現する方法を開発し,国際会議CVPR2018で発表した.その後の研究で,画像と言語の融合タスク複数を,同一のネットワークによりマルチタスク学習の枠組みで学習する方法を開発し,国際会議CVPR2019で発表予定である.
この他,質感認識の応用として,ファッションの着合わせの良し悪しを画像から推定し,ユーザにファッションアイテムの推薦を行う方法を研究してきたが,その推薦の根拠を説明可能な方法を開発し,国際会議に論文を投稿した.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

当初計画の中では,「研究実績の概要」に報告した通り,画質劣化への耐性の向上と,画像と言語の融合タスクにおいて,難関国際会議に論文が複数採択されるなど,進捗は順調である.一方,ランキングタスクにおける人と機械システムの正当な比較方法の理論の構築と,多層CNNとサルの視覚皮質の比較分析については,研究は一定の進捗を見ているものの,成果の公表が十分に行えていない.以上を総合的に判断すると,進捗はおおむね順調であると判断される.

Strategy for Future Research Activity

これまで,多様な要因で低下した入力画像の画質を,CNNを用いて改善する方法を研究してきた.そこでは,異なる要因ごとに個別のCNNをデザインし,学習を行う必要があった.今後は,マルチタスク学習等の手法を用いて,単一のCNNで多様な画質低下を扱うことのできる方法の実現に取り組む.この取り組みを通じ,画質低下を改善する上で必須と考えられる「自然画像の構造」が,CNN内でどのように表現されているかを分析することを目指す.質感は画質と深いつながりがあるが,この分析によって質感を構成する要因が何であるかを考え,一定の知見としてまとめる.
次に,多層CNNとサルの視覚皮質の比較分析については,本領域で開発された質感画像データセットを用い,サルの視覚野の脳皮質電位図と多層CNNの関係を調べて行く.画像をサルに提示し,脳活動を記録するとともにその分析を進めることにしている.
また,ランキングタスクにおける人と機械システムの正当な比較方法の理論の構築と,多層CNNとサルの視覚皮質の比較分析については,成果の公表を進めることとする.

  • Research Products

    (22 results)

All 2019 2018

All Journal Article (9 results) (of which Peer Reviewed: 9 results,  Open Access: 8 results) Presentation (13 results) (of which Int'l Joint Research: 4 results,  Invited: 11 results)

  • [Journal Article] Revisiting Single Image Depth Estimation: Toward Higher Resolution Maps With Accurate Object Boundaries2019

    • Author(s)
      Junjie Hu, Mete Ozay, Yan Zhang, Takayuki Okatani:
    • Journal Title

      Proceedings of IEEE Winter Conference on Applications of Computer Vision

      Volume: - Pages: 1043-1051

    • DOI

      10.1109/WACV.2019.00116

    • Peer Reviewed / Open Access
  • [Journal Article] Improving Generalization Ability of Deep Neural Networks for Visual Recognition Tasks2019

    • Author(s)
      Okatani Takayuki、Liu Xing、Suganuma Masanori
    • Journal Title

      Proceedings of International Workshop on Computational Color Imaging

      Volume: - Pages: 3~13

    • DOI

      10.1007/978-3-030-13940-7_1

    • Peer Reviewed
  • [Journal Article] Dual Residual Networks Leveraging the Potential of Paired Operations for Image Restoration2019

    • Author(s)
      Xing Liu, Masanori Suganuma, Zhun Sun, Takayuki Okatani
    • Journal Title

      Proceedings of IEEE Conference on Computer Vision and Pattern Recognition

      Volume: - Pages: 印刷中

    • Peer Reviewed / Open Access
  • [Journal Article] Attention-based Adaptive Selection of Operations for Image Restoration in the Presence of Unknown Combined Distortions2019

    • Author(s)
      Masanori Suganuma, Xing Liu, Takayuki Okatani
    • Journal Title

      Proceedings of IEEE Conference on Computer Vision and Pattern Recognition

      Volume: - Pages: 印刷中

    • Peer Reviewed / Open Access
  • [Journal Article] Multi-task Learning of Hierarchical Vision-Language Representation2019

    • Author(s)
      Nguyen Duy-Kien、Okatani Takayuki
    • Journal Title

      Proceedings of IEEE Conference on Computer Vision and Pattern Recognition

      Volume: - Pages: 印刷中

    • Peer Reviewed / Open Access
  • [Journal Article] Improved Fusion of Visual and Language Representations by Dense Symmetric Co-attention for Visual Question Answering2018

    • Author(s)
      Nguyen Duy-Kien、Okatani Takayuki
    • Journal Title

      Proceedings of IEEE Conference on Computer Vision and Pattern Recognition

      Volume: - Pages: 6087-6096

    • DOI

      10.1109/CVPR.2018.00637

    • Peer Reviewed / Open Access
  • [Journal Article] Feature Quantization for Defending Against Distortion of Images2018

    • Author(s)
      Sun Zhun、Ozay Mete、Zhang Yan、Liu Xing、Okatani Takayuki
    • Journal Title

      Proceedings of IEEE Conference on Computer Vision and Pattern Recognition

      Volume: - Pages: 7957-7966

    • DOI

      10.1109/CVPR.2018.00830

    • Peer Reviewed / Open Access
  • [Journal Article] Exploiting the Potential of Standard Convolutional Autoencoders for Image Restoration by Evolutionary Search2018

    • Author(s)
      Masanori Suganuma, Mete Ozay, Takayuki Okatani
    • Journal Title

      Proceedings of Machine Learning Research

      Volume: 80 Pages: 47714780

    • DOI

      http://proceedings.mlr.press/v80/suganuma18a.html

    • Peer Reviewed / Open Access
  • [Journal Article] Recommending Outfits from Personal Closet2018

    • Author(s)
      Tangseng Pongsate、Yamaguchi Kota、Okatani Takayuki
    • Journal Title

      Proceedings of IEEE Winter Conference on Applications of Computer Vision

      Volume: - Pages: 269-277

    • DOI

      10.1109/WACV.2018.00036

    • Peer Reviewed / Open Access
  • [Presentation] AIの中核技術としての深層学習の限界と可能性2019

    • Author(s)
      岡谷貴之
    • Organizer
      AIビジネス推進コンソーシアムAIBPC Meetup winter 2019
    • Invited
  • [Presentation] 深層学習のフロンティア:画像応用を中心に2019

    • Author(s)
      岡谷貴之
    • Organizer
      JSPS産学協力研究委員会「生体ひかりイメージング技術と応用第185委員会」2月期185委員会研究会
    • Invited
  • [Presentation] AI(主に深層学習)の現状2019

    • Author(s)
      岡谷貴之
    • Organizer
      土木学会・構造工学でのAI活用に関する研究小委員会
    • Invited
  • [Presentation] 深層学習の基礎~最先端2019

    • Author(s)
      岡谷貴之
    • Organizer
      AIOptics第1回研究会
    • Invited
  • [Presentation] Improving Generalization Ability of Deep Neural Networks for Visual Recognition Tasks2019

    • Author(s)
      Takayuki Okatani
    • Organizer
      Computational Color Imaging Workshop 2019
    • Int'l Joint Research / Invited
  • [Presentation] Perturbation Tolerance of Deep Neural Networks and Humans in Material Recognition2018

    • Author(s)
      Xing LIU, Masataka SAWAYAMA, Ryusuke HAYASHI, Mete OZAY, Takayuki Okatani, Shin'ya NISHIDA
    • Organizer
      Vision Sciences Society Annual Meeting
    • Int'l Joint Research
  • [Presentation] Toward Computer Vision Capable of Understanding Objects Beyond Their Categories Like Humans Do2018

    • Author(s)
      Takayuki Okatani
    • Organizer
      Hekksagon Data Science Workshop
    • Int'l Joint Research / Invited
  • [Presentation] 画像認識・処理のための深層学習の研究の最新動向と今後, 第21回 けいはんな「エジソンの会」2018

    • Author(s)
      岡谷貴之
    • Organizer
      第21回 けいはんな「エジソンの会」
    • Invited
  • [Presentation] AIとディープラーニングの現在と今後2018

    • Author(s)
      岡谷貴之
    • Organizer
      みやぎ組込み産業振興協議会第12回通常総会
    • Invited
  • [Presentation] ディープラーニング:基礎から最近のトレンドまで2018

    • Author(s)
      岡谷貴之
    • Organizer
      第149回微小光学研究会
    • Invited
  • [Presentation] 深層学習のこれまで,現在と今後---画像応用を中心とした議論2018

    • Author(s)
      岡谷貴之
    • Organizer
      精密工学会第397講習会
    • Invited
  • [Presentation] 画像分野でのAI特に深層学習の現在と今後2018

    • Author(s)
      岡谷貴之
    • Organizer
      日本光学会年次学術講演会・AI Opticsキックオフシンポジウム
    • Invited
  • [Presentation] Toward Computer Vision for Understanding Objects Beyond Their Categories2018

    • Author(s)
      Takayuki Okatani
    • Organizer
      Bilateral Workshop between Tohoku University and National Tsing Hua University
    • Int'l Joint Research

URL: 

Published: 2019-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi