• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2022 年度 実施状況報告書

高難度データ認識と高精細データ生成のための「注意深い」深層学習モデルの開発

研究課題

研究課題/領域番号 22K12184
研究機関東京電機大学

研究代表者

日高 章理  東京電機大学, 理工学部, 准教授 (70553519)

研究分担者 栗田 多喜夫  広島大学, 先進理工系科学研究科(工), 教授 (10356941)
研究期間 (年度) 2022-04-01 – 2025-03-31
キーワード深層学習 / 深層注意機構 / Attention module / 視覚的注意 / 物体検出
研究実績の概要

主な研究成果の一つとして,最新の深層物体検出モデルであるYoloX法およびYolo v7法について,squeeze and excitation (SE) block,efficient channel attention (ECA) block,convolution block attention module (CBAM),coordinate attention (CA) block, Recursive Gated Convolutions (RGC)などの深層注意機構を組み込んだ検出モデルを開発し,学会発表を行った.提案モデルにより,従来モデル(YoloX, Yolo v7)の高速な処理速度をほとんど低下させずにより高い検出精度指標(mAP)を実現できた.また,検出結果を目視した定性的評価では遠方で折り重なった小さな見えづらい物体や,夜間の不鮮明な物体に対する誤検出が改善している傾向が見られ,注意機構の導入により判別が難しい物体をより正確に認識する能力を獲得できたものと考えられる.当該研究成果の一部は国際会議WSPML2022で発表し,残りの成果は国際会議ICANN2023に投稿中である.
また別の研究成果として,代表的な深層学習モデルであるAlexnetについて,霊長類の大脳視覚野との類似性や相違性を検証する研究を行い,成果を学術論文誌(Frontiers in Computational Neuroscience)で公表した.当該研究では一般的な画像分類のために学習されたAlexnetモデルの挙動が,人間の物体知覚の仕組み(特に視覚的注意の機構)と質的に異なることが確認され,通常の画像分類モデルでは注意の能力を獲得しにくい可能性が示唆された.したがってボトムアップ型注意やトップダウン型注意の機構を別途導入することが重要となる.

現在までの達成度 (区分)
現在までの達成度 (区分)

1: 当初の計画以上に進展している

理由

R4年度の研究計画では,本研究課題で掲げる3つの研究目的のうち,1つめに当たる「(X) 新たなボトムアップ型注意機構の開発と応用」に取り組む予定としていた.当該の研究目的はR4~R6年度の3年間で継続的・段階的に研究進捗する予定としており,R4年度はまず既存の物体検出モデルの途中層に何らかのボトムアップ型注意機構を組み込むことを目指していた.R4年度末の時点で既に複数の検出モデル(YoloX, Yolo v7)に複数の注意機構(SE, ECA, CBAM, CA, RGC)を組み込んだ実験が完了し,良好な検出性能を実現することができている.また,同様のアプローチとして,Faster R-CNN法に別種の注意機構(Self-attention, Source-target attention, Lambda layer)を組み込んだ実験も行っており,同じく検出精度を改善できている.この結果についても現在英語論文化を準備している.
これらの研究成果の一部は既に国際学会にて発表済みであり,残りの成果も論文投稿中ないし論文化準備中であることから,当初の予定より早く研究が進捗していると言える.

今後の研究の推進方策

R5年度の研究計画では,本研究課題で掲げる3つの研究目的のうち,1つめの目的に当たる「(X) 新たなボトムアップ型注意機構の開発と応用」について継続的に研究進捗しつつ,2つめの目的に当たる「(Y) 能動的トップダウン型注意機構の開発」に本格的に取り組む予定である.
研究目的(X)については,R5年時点の最新検出モデルであるYolo v8法にボトムアップ型注意機構を組み込む研究や,新たなボトムアップ型注意機構の開発を行う予定である.新たなボトムアップ型注意機構の開発では,ヒトなどの大脳視覚野に見られる特徴的な挙動(例えば「ポップアウト効果」など)を手がかりとして,それらを深層学習モデルの内部処理で再現する機構を実現し,それらによって画像認識や画像生成の精度を向上することを目指す.
研究目的(Y)については,再帰型CNN (Recurrent CNN)法やVisionTransformer法をベースとして,認識対象の弁別の困難度に応じて再帰的に注意機構を用いた認識処理を行うことで,視認困難な対象をより注意深く正確に弁別する枠組みを開発する予定である.

次年度使用額が生じた理由

本研究課題のために,GPGPU(RTX3090)搭載の並列計算用PCを新調する予定であったが,同年度に他の研究課題で得た研究費によって類似の並列計算用PCを複数用意することができた.それにより,元々他の研究課題の方で使用する予定であった保有済みの並列計算用PC(過去の科研費で調達したもの等)を本研究課題の方で利用して実験を行うことができていた.また,当該年度の下半期に所望のGPGPU機種(RTX3090)の後継機となるRTX4090が発売される予定となっていたため,処理速度の面で優位性を鑑みて,そちらを搭載したPCを調達することとした.
しかし,当該年度の10月末頃に後継機種が発売されたところ,折からのコロナ禍による物流混乱や半導体不足の影響のためか,単体での価格が30~35万円と高騰しており,当初想定のPC用予算(40~45万円程度)では調達が難しいことから,次年度予算と合わせて調達を行うこととした.

  • 研究成果

    (2件)

すべて 2022

すべて 雑誌論文 (1件) (うち査読あり 1件、 オープンアクセス 1件) 学会発表 (1件) (うち国際学会 1件)

  • [雑誌論文] Analysis based on neural representation of natural object surfaces to elucidate the mechanisms of a trained AlexNet model2022

    • 著者名/発表者名
      Wagatsuma Nobuhiko、Hidaka Akinori、Tamura Hiroshi
    • 雑誌名

      Frontiers in Computational Neuroscience

      巻: 16 ページ: 1-17

    • DOI

      10.3389/fncom.2022.979258

    • 査読あり / オープンアクセス
  • [学会発表] Attention-YOLOX: Improvement in On-road Object Detection by Introducing Attention Mechanisms to YOLOX2022

    • 著者名/発表者名
      Yuning Shi and Akinori Hidaka
    • 学会等名
      2022 International Workshop on Signal Processing and Machine Learning (WSPML 2022)
    • 国際学会

URL: 

公開日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi