2020 Fiscal Year Annual Research Report

深奥質感のマルチモーダル深層モデルの確立

Planned Research

Project Area	Analysis and synthesis of deep SHITSUKAN information in the real world
Project/Area Number	20H05952
Research Institution	Tohoku University
Principal Investigator	岡谷貴之東北大学, 情報科学研究科, 教授 (00312637)
Co-Investigator(Kenkyū-buntansha)	菅沼雅徳東北大学, 情報科学研究科, 助教 (00815813) 劉星東北大学, 情報科学研究科, 特任助教 (60870095) 鈴木潤東北大学, データ駆動科学・AI教育研究センター, 教授 (80396150)
Project Period (FY)	2020-11-19 – 2025-03-31
Keywords	コンピュータビジョン / 質感認識 / 深層学習 / 自然言語処理
Outline of Annual Research Achievements	人と同じように認識可能なAIシステムを実現すべく，初年度となる2020年度は研究の準備を行った．「人に近い水準で画像理解を実行できるニューラルネットワークの内部には、多様な質感概念の表現が自動的に獲得される」という仮説を立て，その概念的検討を行った．検討結果の実験的検証には計算機を要したが，コロナ禍の中，その調達が当該年度中に行えず，翌2021年度に予算の繰越を行った．翌2021年度においては，まず必要な計算環境を整えた後，DNNによる画像理解の研究を行い，複数の成果を得た．第一に，自然言語の指示によって作業を行うAIエージェントを開発した．手法は，国際的なベンチマークテストAlfredにおいて論文発表時点で全世界トップの性能を達成するとともに，成果の一端を国際会議IJACI2021にて発表した. 第二に，画像理解タスクの性能向上を目指して，画像記述の研究を行った．まず，これまでの手法が「比喩的表現」を基本的に行えないことに着目し，データセットとベンチマークテストを設計するとともに，評価方法を検討した．第三に，画像記述のためのより高性能かつ高効率なDNNの設計を行った.画像特徴を取り出すのに，従来手法のように物体検出器に由来するCNNを使うのではなく，トランスフォーマーを用いることで高速化を達成した．国際的なベンチマークテストCOCO captionsにおいて，世界トップクラスの記述精度を従来手法の少なくとも数分の1の計算量で達成可能なDNNとなっている．以上の２つの成果はそれぞれ1本の論文として，国際会議に投稿中である．この他，自己教師学習の方法について研究を行い，特に近年活発に研究されている負例を用いない画像特徴の自己教師学習手法について，その有効性がどこから由来するものかを理論的に検討した．その成果は国際会議に投稿中である．
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason 本研究計画は2020年度後半にスタートしたが，コロナ禍の中，導入を予定していた計算機一式の購入が不可能となり，翌2021年度に予算の一部を繰越した．その後，予定していた性能の計算機一式を，入札を経て購入に漕ぎ着け，研究を加速することができた．
Strategy for Future Research Activity	上述の通り本研究計画はおおむね順調に進展しているが，関連分野の研究は著しく早いペースで進展しており，それへの適切な対応が欠かせない.言語で指定した通りの画像を，それがかなり高度で込み入った内容であっても，人間の芸術家も顔負けするような素晴らしい画像(絵画)を生成する手法(例えばDALI- E2)や，巨大言語モデルの限界の見えない進展などである.これらの新規技術は質感認知にも大きな影響を与えようとし始めており，それらとどう向き合い，取り込むかが問われている.発展の内容の予測の難しさとペースの速さから，現時点で，その具体的方法を簡潔に述べることは不可能であり，最先端の研究内容にキャッチアップすることを怠らず，本研究の最終目標を見失うことなく，着実に研究を進める他ない.

Research Products
(7 results)

All 2021

All Journal Article (3 results) (of which Int'l Joint Research: 3 results, Peer Reviewed: 3 results, Open Access: 3 results) Presentation (4 results) (of which Invited: 4 results)

[Journal Article] Look Wide and Interpret Twice: Improving Performance on Interactive Instruction-following Tasks2021
- Author(s)
  Van-Quang Nguyen, Masanori Suganuma, Takayuki Okatani
- Journal Title
  
  Proceedings of 30th International Joint Conference on Artificial Intelligence (IJCAI-21)
  
  Volume: - Pages: 923-930
- DOI
  10.24963/ijcai.2021/128
- Peer Reviewed / Open Access / Int'l Joint Research
[Journal Article] Matching in the Dark: A Dataset for Matching Image Pairs of Low-light Scenes2021
- Author(s)
  Wenzheng Song, Masanori Suganuma, Xing Liu, Noriyuki Shimobayashi, Daisuke Maruta, Takayuki Okatani
- Journal Title
  
  Proceedings of International Conference on Computer Visionツ?2021
  
  Volume: - Pages: 6009-6018
- DOI
  10.1109/ICCV48922.2021.00597
- Peer Reviewed / Open Access / Int'l Joint Research
[Journal Article] Progressive and Selective Fusion Network for High Dynamic Range Imaging2021
- Author(s)
  Qian Ye, Jun Xiao, Kin-Man Lam, Takayuki Okatani
- Journal Title
  
  Proceedings of ACM Multimedia 2021
  
  Volume: - Pages: 5290-5297
- DOI
  10.1145/3474085.3475651
- Peer Reviewed / Open Access / Int'l Joint Research
[Presentation] 深層学習の現在と近未来:深奥質感からAIの今後を考える2021
- Author(s)
  岡谷貴之
- Organizer
  新道路成果報告会AI活用
- Invited
[Presentation] 深層学習の現在:問題解決の方法論として2021
- Author(s)
  岡谷貴之
- Organizer
  日本天文学会
- Invited
[Presentation] ディープラーニングの課題: 現場からフロンティアまで2021
- Author(s)
  岡谷貴之
- Organizer
  日本機会学会
- Invited
[Presentation] 深層学習(≒AI)の現在と近い将来2021
- Author(s)
  岡谷貴之
- Organizer
  精密工学会
- Invited

2020 Fiscal Year Annual Research Report

深奥質感のマルチモーダル深層モデルの確立

Principal Investigator

岡谷 貴之 東北大学, 情報科学研究科, 教授 (00312637)

Current Status of Research Progress

Reason

Research Products

[Journal Article] Look Wide and Interpret Twice: Improving Performance on Interactive Instruction-following Tasks2021

Author(s)

Journal Title

DOI

[Journal Article] Matching in the Dark: A Dataset for Matching Image Pairs of Low-light Scenes2021

Author(s)

Journal Title

DOI

[Journal Article] Progressive and Selective Fusion Network for High Dynamic Range Imaging2021

Author(s)

Journal Title

DOI

[Presentation] 深層学習の現在と近未来:深奥質感からAIの今後を考える2021

Author(s)

Organizer

[Presentation] 深層学習の現在:問題解決の方法論として2021

Author(s)

Organizer

[Presentation] ディープラーニングの課題: 現場からフロンティアまで2021

Author(s)

Organizer

[Presentation] 深層学習(≒AI)の現在と近い将来2021

Author(s)

Organizer

岡谷貴之東北大学, 情報科学研究科, 教授 (00312637)