• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2022 Fiscal Year Research-status Report

高難度データ認識と高精細データ生成のための「注意深い」深層学習モデルの開発

Research Project

Project/Area Number 22K12184
Research InstitutionTokyo Denki University

Principal Investigator

日高 章理  東京電機大学, 理工学部, 准教授 (70553519)

Co-Investigator(Kenkyū-buntansha) 栗田 多喜夫  広島大学, 先進理工系科学研究科(工), 教授 (10356941)
Project Period (FY) 2022-04-01 – 2025-03-31
Keywords深層学習 / 深層注意機構 / Attention module / 視覚的注意 / 物体検出
Outline of Annual Research Achievements

主な研究成果の一つとして,最新の深層物体検出モデルであるYoloX法およびYolo v7法について,squeeze and excitation (SE) block,efficient channel attention (ECA) block,convolution block attention module (CBAM),coordinate attention (CA) block, Recursive Gated Convolutions (RGC)などの深層注意機構を組み込んだ検出モデルを開発し,学会発表を行った.提案モデルにより,従来モデル(YoloX, Yolo v7)の高速な処理速度をほとんど低下させずにより高い検出精度指標(mAP)を実現できた.また,検出結果を目視した定性的評価では遠方で折り重なった小さな見えづらい物体や,夜間の不鮮明な物体に対する誤検出が改善している傾向が見られ,注意機構の導入により判別が難しい物体をより正確に認識する能力を獲得できたものと考えられる.当該研究成果の一部は国際会議WSPML2022で発表し,残りの成果は国際会議ICANN2023に投稿中である.
また別の研究成果として,代表的な深層学習モデルであるAlexnetについて,霊長類の大脳視覚野との類似性や相違性を検証する研究を行い,成果を学術論文誌(Frontiers in Computational Neuroscience)で公表した.当該研究では一般的な画像分類のために学習されたAlexnetモデルの挙動が,人間の物体知覚の仕組み(特に視覚的注意の機構)と質的に異なることが確認され,通常の画像分類モデルでは注意の能力を獲得しにくい可能性が示唆された.したがってボトムアップ型注意やトップダウン型注意の機構を別途導入することが重要となる.

Current Status of Research Progress
Current Status of Research Progress

1: Research has progressed more than it was originally planned.

Reason

R4年度の研究計画では,本研究課題で掲げる3つの研究目的のうち,1つめに当たる「(X) 新たなボトムアップ型注意機構の開発と応用」に取り組む予定としていた.当該の研究目的はR4~R6年度の3年間で継続的・段階的に研究進捗する予定としており,R4年度はまず既存の物体検出モデルの途中層に何らかのボトムアップ型注意機構を組み込むことを目指していた.R4年度末の時点で既に複数の検出モデル(YoloX, Yolo v7)に複数の注意機構(SE, ECA, CBAM, CA, RGC)を組み込んだ実験が完了し,良好な検出性能を実現することができている.また,同様のアプローチとして,Faster R-CNN法に別種の注意機構(Self-attention, Source-target attention, Lambda layer)を組み込んだ実験も行っており,同じく検出精度を改善できている.この結果についても現在英語論文化を準備している.
これらの研究成果の一部は既に国際学会にて発表済みであり,残りの成果も論文投稿中ないし論文化準備中であることから,当初の予定より早く研究が進捗していると言える.

Strategy for Future Research Activity

R5年度の研究計画では,本研究課題で掲げる3つの研究目的のうち,1つめの目的に当たる「(X) 新たなボトムアップ型注意機構の開発と応用」について継続的に研究進捗しつつ,2つめの目的に当たる「(Y) 能動的トップダウン型注意機構の開発」に本格的に取り組む予定である.
研究目的(X)については,R5年時点の最新検出モデルであるYolo v8法にボトムアップ型注意機構を組み込む研究や,新たなボトムアップ型注意機構の開発を行う予定である.新たなボトムアップ型注意機構の開発では,ヒトなどの大脳視覚野に見られる特徴的な挙動(例えば「ポップアウト効果」など)を手がかりとして,それらを深層学習モデルの内部処理で再現する機構を実現し,それらによって画像認識や画像生成の精度を向上することを目指す.
研究目的(Y)については,再帰型CNN (Recurrent CNN)法やVisionTransformer法をベースとして,認識対象の弁別の困難度に応じて再帰的に注意機構を用いた認識処理を行うことで,視認困難な対象をより注意深く正確に弁別する枠組みを開発する予定である.

Causes of Carryover

本研究課題のために,GPGPU(RTX3090)搭載の並列計算用PCを新調する予定であったが,同年度に他の研究課題で得た研究費によって類似の並列計算用PCを複数用意することができた.それにより,元々他の研究課題の方で使用する予定であった保有済みの並列計算用PC(過去の科研費で調達したもの等)を本研究課題の方で利用して実験を行うことができていた.また,当該年度の下半期に所望のGPGPU機種(RTX3090)の後継機となるRTX4090が発売される予定となっていたため,処理速度の面で優位性を鑑みて,そちらを搭載したPCを調達することとした.
しかし,当該年度の10月末頃に後継機種が発売されたところ,折からのコロナ禍による物流混乱や半導体不足の影響のためか,単体での価格が30~35万円と高騰しており,当初想定のPC用予算(40~45万円程度)では調達が難しいことから,次年度予算と合わせて調達を行うこととした.

  • Research Products

    (2 results)

All 2022

All Journal Article (1 results) (of which Peer Reviewed: 1 results,  Open Access: 1 results) Presentation (1 results) (of which Int'l Joint Research: 1 results)

  • [Journal Article] Analysis based on neural representation of natural object surfaces to elucidate the mechanisms of a trained AlexNet model2022

    • Author(s)
      Wagatsuma Nobuhiko、Hidaka Akinori、Tamura Hiroshi
    • Journal Title

      Frontiers in Computational Neuroscience

      Volume: 16 Pages: 1-17

    • DOI

      10.3389/fncom.2022.979258

    • Peer Reviewed / Open Access
  • [Presentation] Attention-YOLOX: Improvement in On-road Object Detection by Introducing Attention Mechanisms to YOLOX2022

    • Author(s)
      Yuning Shi and Akinori Hidaka
    • Organizer
      2022 International Workshop on Signal Processing and Machine Learning (WSPML 2022)
    • Int'l Joint Research

URL: 

Published: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi