Research on Dynamic Scene Recognition Algorithm for Autonomous Mobile Robot

Research Project

Project/Area Number	22K12079
Research Category	Grant-in-Aid for Scientific Research (C)
Allocation Type	Multi-year Fund
Section	一般
Review Section	Basic Section 61010:Perceptual information processing-related
Research Institution	Kogakuin University
Principal Investigator	陳キュウ工学院大学, 情報学部(情報工学部), 教授 (00400292)
Project Period (FY)	2022-04-01 – 2025-03-31
Project Status	Granted (Fiscal Year 2023)
Budget Amount *help	¥4,290,000 (Direct Cost: ¥3,300,000、Indirect Cost: ¥990,000) Fiscal Year 2024: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000) Fiscal Year 2023: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000) Fiscal Year 2022: ¥2,080,000 (Direct Cost: ¥1,600,000、Indirect Cost: ¥480,000)
Keywords	シーン認識 / ディープラーニング / ディープニューラルネットワーク / 移動ロボット / アテンション機構
Outline of Research at the Start	未曾有の「超高齢社会」に急速に進む中、介護を始めとする様々な用途でサービスロボットの需要が高まっている。自律移動ロボットが自動で見回り・警備に当たるためには随時周囲の環境を認識する必要がある。これまではシーン認識は主に静止画像情報から行ってきたが、より精度の高いシーン認識を実現するため、本研究では、我々は静止画像だけではなく、複数アテンション機構を用いたディープニューラルネットワークの手法で効率よく動画像の時空間深層特徴情報を抽出し、またキーフレームから抽出された高度な空間深層特徴量との組み合わせで特徴統合による高度な動的シーン認識のモデルを確立し、高精度な動的シーン認識を実現する。
Outline of Annual Research Achievements	近年、深層学習の方法、特に畳み込みネットワーク(CNN)の登場により、シーン認識には大きな精度向上が実現しているが、移動ロボットに向けて動的なシーン認識手法がほとんど提案されていない。強力な動的シーン認識モデルを構築するためには、時間情報と空間情報の両方を抽出する必要がある。静止画像ベースの特徴抽出手法を利用して動的シーンの認識には理論上の限界があるので、精度面ではまだ十分とは言えない。本研究では、より良いシーン表現のために、静止画像だけではなく、ビデオ、キーフレーム画像の深層特徴情報を抽出し、特徴統合による高精度な動的シーン認識手法を試みた。そして、今年度の研究成果は以下のようになる。 Video Transformerがビデオ内のフレームの時間的および空間的な相互作用を考慮することで、ビデオシーケンスの特徴を学習できるため、入力されたビデオストリームの時空間情報が含まれる深層特徴を生成した。また、ビデオストリームから抽出されたキーフレームのグローバル特徴情報と局所特徴情報をそれぞれTransformerと畳み込みニューラルネットワーク(CNN)により抽出して統合することにより、シーン画像の空間的な情報が表すことができた。さらに、ノイズのあるデータセットを用いたネットワークの学習方法についても検討した。人間のラベル付けデータはしばしば曖昧であり、不正確なラベルが存在するため、精度を向上させる新しい手法GOODを提案した。具体的には、物体検出に勾配最適化を適用する手法として、勾配降下法を修正し、不正確なラベルの影響を軽減した。公開データセットPASCAL VOC 2012とCOCO 2017での検証実験により、提案手法の効果が示された。特に、PASCAL VOC 2012では9.4%、COCO 2017では5.2%の改善が実現された。
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason 時間情報と空間情報の両方を抽出して動的シーン特徴統合手法、及び高精度シーン認識手法を確立し、計画通りに研究を進めている。研究計画書で立てた目標を明確にし、必要なデータや情報を収集しながら、計画的かつ効率的な研究を進めている。また、研究の方針や手法について、定期的に検討を重ね、適切な修正を加えながら、研究の方向性を確実にしていることも一因として挙げられる。引き続き、必要な情報の収集を行いながら、研究を推進していく。
Strategy for Future Research Activity	これからの研究は当初の予定通りで、動的シーン認識手法の検討、また、動的シーン認識システムの構築を試みる予定である。高精度シーン認識手法の研究において、移動ロボットに提案手法を実装し、検証システムを構築する。インターネット上で収集および作成したシーンの各種データセットなどでデータベースを構築し、購入したワークステーションにて動的シーン認識手法の確立と検討し、さらに移動ロボットに実際なシステムを実装し、稼働させて検証実験を行う。

Report

(2 results)

2023 Research-status Report
2022 Research-status Report

Research Products
(21 results)

All 2024 2023 2022

All Journal Article (6 results) (of which Int'l Joint Research: 6 results, Peer Reviewed: 6 results, Open Access: 3 results) Presentation (15 results) (of which Int'l Joint Research: 4 results)

[Journal Article] Gradient optimization for object detection in learning with noisy labels2024
- Author(s)
  Q. Xia, C. Hu, F. Lee, Q. Chen
- Journal Title
  
  Applied Intelligence
  
  Volume: 54 Issue: 5 Pages: 4248-4259
- DOI
  10.1007/s10489-024-05357-6
- Related Report
  2023 Research-status Report
- Peer Reviewed / Int'l Joint Research
[Journal Article] HCT-net: hybrid CNN-transformer model based on a neural architecture search network for medical image segmentation2023
- Author(s)
  Z. Yu, F. Lee, Q. Chen
- Journal Title
  
  Applied Intelligence
  
  Volume: 53 Issue: 17 Pages: 19990-20006
- DOI
  10.1007/s10489-023-04570-z
- Related Report
  2023 Research-status Report
- Peer Reviewed / Int'l Joint Research
[Journal Article] DMA-Net: Decoupled Multi-Scale Attention for Few-Shot Object Detection2023
- Author(s)
  X. Xie, F. Lee, Q. Chen
- Journal Title
  
  Applied Sciences
  
  Volume: 13 Issue: 12 Pages: 6933-6933
- DOI
  10.3390/app13126933
- Related Report
  2023 Research-status Report
- Peer Reviewed / Open Access / Int'l Joint Research
[Journal Article] TCC-net: A two-stage training method with contradictory loss and co-teaching based on meta-learning for learning with noisy labels2023
- Author(s)
  Q. Xia, F. Lee, Q. Chen
- Journal Title
  
  Information Sciences
  
  Volume: 639 Pages: 119008-119008
- DOI
  10.1016/j.ins.2023.119008
- Related Report
  2022 Research-status Report
- Peer Reviewed / Int'l Joint Research
[Journal Article] SRUNet: Stacked Reversed U-Shape Network for Lightweight Single Image Super-Resolution2022
- Author(s)
  Z. Feng, F. Lee, Q. Chen
- Journal Title
  
  IEEE Access
  
  Volume: 10 Pages: 60151-60162
- DOI
  10.1109/access.2022.3180206
- Related Report
  2022 Research-status Report
- Peer Reviewed / Open Access / Int'l Joint Research
[Journal Article] Fall Detection System on Smart Walker Based on Multisensor Data Fusion and SPRT Method2022
- Author(s)
  D. Ding, Y. Wang, W. Zhang, Q. Chen
- Journal Title
  
  IEEE Access
  
  Volume: 10 Pages: 80932-80948
- DOI
  10.1109/access.2022.3195674
- Related Report
  2022 Research-status Report
- Peer Reviewed / Open Access / Int'l Joint Research
[Presentation] ディープニューラルネットワークを活用した動画中の複数人物の追跡手法の検討2024
- Author(s)
  森下翔登, 陳キュウ
- Organizer
  画像工学研究会
- Related Report
  2023 Research-status Report
[Presentation] 視覚と言語モデルの融合に基づくシーン文字認識手法2024
- Author(s)
  温泉良太, 陳キュウ
- Organizer
  画像工学研究会
- Related Report
  2023 Research-status Report
[Presentation] オムニ集約ネットワークを用いた画像超解像度手法の検討2024
- Author(s)
  鈴木祐太, 陳キュウ
- Organizer
  画像工学研究会
- Related Report
  2023 Research-status Report
[Presentation] ハンドジェスチャー認識によるタッチレス入力方法の検討2024
- Author(s)
  久保田泰仁, 土屋　奎太，陳キュウ
- Organizer
  情報処理学会第86回全国大会
- Related Report
  2023 Research-status Report
[Presentation] Transformerを用いた樹木の健康状態診断手法の検討2024
- Author(s)
  樋口凌空，伊東　明寛，陳キュウ
- Organizer
  情報処理学会第86回全国大会
- Related Report
  2023 Research-status Report
[Presentation] 知識蒸留を用いた物体検出器軽量化手法の検討2024
- Author(s)
  保井志貴，中川　潤一，陳キュウ
- Organizer
  情報処理学会第86回全国大会
- Related Report
  2023 Research-status Report
[Presentation] ReRobo Walker: Robotic Walker with Fall Detection and Active Safety2023
- Author(s)
  D. Ding, Y. Wang, H. Zhang, Q. Meng, H. Yu, Y. Lin, and Q. Chen
- Organizer
  2023 IEEE 18th Conf. on Industrial Electronics and Applications
- Related Report
  2023 Research-status Report
- Int'l Joint Research
[Presentation] 知識蒸留法を用いた物体検出モデルの軽量化手法の検討2023
- Author(s)
  中川潤一, 温泉良太, 陳キュウ
- Organizer
  画像工学研究会
- Related Report
  2023 Research-status Report
[Presentation] Artistic Image Style Transfer Based on Laplacian Pyramid Network2023
- Author(s)
  S. Wang, and Q. Chen
- Organizer
  the 9th Int. Symp. on Affective Science and Engineering
- Related Report
  2022 Research-status Report
- Int'l Joint Research
[Presentation] 知識蒸留による物体検出器の軽量化手法2023
- Author(s)
  中川　潤一, 温泉　良太, 陳キュウ
- Organizer
  2023電子情報通信学会総合大会
- Related Report
  2022 Research-status Report
[Presentation] ディープニューラルネットワークを用いた樹木の健康状態診断手法の軽量化の検討2023
- Author(s)
  田中　瑠奈, 汪　慎知, 陳キュウ
- Organizer
  2023電子情報通信学会総合大会
- Related Report
  2022 Research-status Report
[Presentation] ハンドジェスチャー認識による非接触入力手法2023
- Author(s)
  鎌田　愁, 温泉　良太, 陳キュウ
- Organizer
  2023電子情報通信学会総合大会
- Related Report
  2022 Research-status Report
[Presentation] ディープラーニングによるイラストアニメーションの自動生成手法2023
- Author(s)
  矢野　瑞基, 土屋　奎太, 陳キュウ
- Organizer
  2023電子情報通信学会総合大会
- Related Report
  2022 Research-status Report
[Presentation] Revisit Attention Mechanism in Laplacian Pyramid Network for Artistic Style Transfer2022
- Author(s)
  S. Wang, and Q. Chen
- Organizer
  the 21th Int’l Symp. on Advanced Technology
- Related Report
  2022 Research-status Report
- Int'l Joint Research
[Presentation] Automatic Font Generation System Reflecting Emotions in Voice Based on Adversarial Generative Network2022
- Author(s)
  K. Tsuchiya, T. Nonaka, and Q. Chen
- Organizer
  the 21th Int’l Symp. on Advanced Technology
- Related Report
  2022 Research-status Report
- Int'l Joint Research

Research on Dynamic Scene Recognition Algorithm for Autonomous Mobile Robot

Principal Investigator

陳 キュウ 工学院大学, 情報学部(情報工学部), 教授 (00400292)

¥4,290,000 (Direct Cost: ¥3,300,000、Indirect Cost: ¥990,000)

Current Status of Research Progress

Reason

Report

Research Products

[Journal Article] Gradient optimization for object detection in learning with noisy labels2024

Author(s)

Journal Title

DOI

Related Report

[Journal Article] HCT-net: hybrid CNN-transformer model based on a neural architecture search network for medical image segmentation2023

Author(s)

Journal Title

DOI

Related Report

[Journal Article] DMA-Net: Decoupled Multi-Scale Attention for Few-Shot Object Detection2023

Author(s)

Journal Title

DOI

Related Report

[Journal Article] TCC-net: A two-stage training method with contradictory loss and co-teaching based on meta-learning for learning with noisy labels2023

Author(s)

Journal Title

DOI

Related Report

[Journal Article] SRUNet: Stacked Reversed U-Shape Network for Lightweight Single Image Super-Resolution2022

Author(s)

Journal Title

DOI

Related Report

[Journal Article] Fall Detection System on Smart Walker Based on Multisensor Data Fusion and SPRT Method2022

Author(s)

Journal Title

DOI

Related Report

[Presentation] ディープニューラルネットワークを活用した動画中の複数人物の追跡手法の検討2024

Author(s)

Organizer

Related Report

[Presentation] 視覚と言語モデルの融合に基づくシーン文字認識手法2024

Author(s)

Organizer

Related Report

[Presentation] オムニ集約ネットワークを用いた画像超解像度手法の検討2024

Author(s)

Organizer

Related Report

[Presentation] ハンドジェスチャー認識によるタッチレス入力方法の検討2024

Author(s)

Organizer

Related Report

[Presentation] Transformerを用いた樹木の健康状態診断手法の検討2024

Author(s)

Organizer

Related Report

[Presentation] 知識蒸留を用いた物体検出器軽量化手法の検討2024

Author(s)

Organizer

Related Report

[Presentation] ReRobo Walker: Robotic Walker with Fall Detection and Active Safety2023

Author(s)

Organizer

Related Report

[Presentation] 知識蒸留法を用いた物体検出モデルの軽量化手法の検討2023

Author(s)

Organizer

Related Report

[Presentation] Artistic Image Style Transfer Based on Laplacian Pyramid Network2023

Author(s)

Organizer

Related Report

[Presentation] 知識蒸留による物体検出器の軽量化手法2023

Author(s)

Organizer

Related Report

[Presentation] ディープニューラルネットワークを用いた樹木の健康状態診断手法の軽量化の検討2023

Author(s)

陳キュウ工学院大学, 情報学部(情報工学部), 教授 (00400292)