• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

複数モダリティの知識表現を用いたマルチモーダル構造適応型深層学習の研究

研究課題

研究課題/領域番号 21K17809
研究種目

若手研究

配分区分基金
審査区分 小区分61030:知能情報学関連
研究機関広島市立大学 (2022-2023)
県立広島大学 (2021)

研究代表者

鎌田 真  広島市立大学, 情報科学研究科, 准教授 (30845178)

研究期間 (年度) 2021-04-01 – 2025-03-31
研究課題ステータス 交付 (2023年度)
配分額 *注記
4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)
2023年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2022年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2021年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
キーワード深層学習 / マルチモーダル / 構造適応型学習 / ビッグデータ / 知識獲得
研究開始時の研究の概要

本研究では,音声,自然言語等の複数のモダリティを並列的に処理し,モダリティ間の関係性を考慮した上で合成・融合し,最終的な出力判定を行うマルチモーダル構造適応型深層学習を探求する。複数のモデル間の確率分布の違いをKL情報量により測定し,類似性に基づいてモダリティ間の共通成分を知識獲得手法について研究する。入力に欠損値があった場合や一つのモダリティで曖昧な判定が行われた場合でも,別のモダリティがもつ知識に基づいて補間し,その他の情報と合成することで人間のような高次の情報処理を実現する。動画等のビッグデータに適用し評価する。

研究実績の概要

入力データに対して適応的に隠れニューロン数や層の数を自動で生成/消去する構造適応型深層学習法を開発した。本手法は,様々な画像分類ベンチマークデータセットに対して従来手法よりも高い分類精度を示してきた。さらに,KL情報量に基づき,複数モデルを用いたTeacher-Student型構造適応型深層学習法を開発し,顔感情分類,胸部X線画像における疾病検出,コンクリート画像におけるひび割れ検出,衛星写真からの道路検出,時系列データ予測などへの応用を行い,本手法の有効性を示してきた。しかしながら,顔や音声に含まれる感情の分類などの複雑で曖昧性をもつデータについては,単一のモダリティのみでは判定困難なケースが見られた。深層学習では,複数の異なる入力を同時に学習するマルチモーダル深層学習が提案されているが,各モダリティ間の特徴や知識表現に基づき,最終判定のために適切に合成・融合する手法は少ない。このため,本研究では,動画像,音声等の複数のモダリティを入力とし,個別のモデルとして並列的に処理し,モダリティ間の関係性を考慮した上で合成し,最終的な出力判定を行うマルチモーダル構造適応型深層学習について探求した。音声付きの顔表情動画から8種類の顔感情を推定するデータセットRAVDESSを用いて提案手法の性能評価を行ったところ,音声と顔表情画像の2つのモダリティに対して,結合パラメタを適切に調整した上で合成し,予測することで,従来手法よりも高い分類性能が得られた。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

2022年度では,マルチモーダル深層学習として,親モデルと複数の子モデルを用いたTeacher-Student構造適応型深層学習法の改良を行った。入力データに含まれる多様な特徴を親モデルと複数の子モデルで学習し,KL情報をもとに,子モデルに蓄積されている特徴や知識表現を親に転移させることで,分類性能の向上を実現した。開発したモデルを複数のデータセットに適用し,手法の評価を行った。具体的には,MRI/PET画像に適用し,認知症早期判定のための深層学習システムを開発した。また,航空写真とグラフ探索に基づき,道路網地図を自動検出するRoadTracerに適用し,既存の手法よりも高い性能を示し,論文投稿を行った。さらに,マルチモーダル深層学習として,多様なデータを学習可能にするため,構造適応型深層学習法におけるセグメンテーション手法を開発した。以前の研究で提案した学習済み深層学習における知識獲得手法に基づき,中間層で得られた特徴パタンから,入力画像における物体の可能性をヒートマップとして可視化し,出力する手法を開発した。公開されている肺の3次元CT画像を用いて,腫瘍領域を自動で抽出するセグメンテーションタスクに適用したところ,既存の手法より高い性能が得られた。
2023年度では,得られた成果に基づき,動画像,音声等の複数のモダリティを入力とし,個別のモデルとして並列的に処理し,モダリティ間の関係性を考慮した上で合成し,最終的な出力判定を行うマルチモーダル構造適応型深層学習法を開発した。RAVDESSデータセットを用いた評価では,異なるモダリティを適切に合成することで,分類性能が向上することが分かり,当初予定していた研究成果が得られた。一方で,学会等で研究成果を公表し,手法の改良を行うため,研究を2024年度まで延長することとした。このため,現在までに進歩状況を,「おおむね順調に進展している」とした。

今後の研究の推進方策

得られた研究成果について,学会等で発表し,外部からの評価を受ける。必要に応じて,手法の改良を行う。

報告書

(3件)
  • 2023 実施状況報告書
  • 2022 実施状況報告書
  • 2021 実施状況報告書
  • 研究成果

    (13件)

すべて 2024 2023 2022 2021

すべて 雑誌論文 (4件) (うち査読あり 4件、 オープンアクセス 2件) 学会発表 (9件) (うち国際学会 2件、 招待講演 1件)

  • [雑誌論文] 3D Lung Tumor Segmentation System using Adaptive Structural Deep Belief Network2024

    • 著者名/発表者名
      Shin Kamada, Takumi Ichimura
    • 雑誌名

      Intelligent Systems Reference Library: Advances in Intelligent Disease Diagnosis and Treatment

      巻: to appear in 2024

    • 関連する報告書
      2023 実施状況報告書
    • 査読あり
  • [雑誌論文] Automatic Extraction of Road Networks by Using Teacher-Student Adaptive Structural Deep Belief Network and Its Application to Landslide Disaster2023

    • 著者名/発表者名
      Shin Kamada, Takumi Ichimura
    • 雑誌名

      IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing

      巻: 16 ページ: 6310-6324

    • DOI

      10.1109/jstars.2023.3293593

    • 関連する報告書
      2023 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] A Teacher-Student based Adaptive Structural Deep learning Model and Its Estimating Uncertainty of Image Data2023

    • 著者名/発表者名
      Takumi Ichimura, Shin Kamada, Toshihide Harada and Ken Inoue
    • 雑誌名

      Handbook of Statistics Volume 49: Artificial Intelligence

      巻: 49

    • 関連する報告書
      2022 実施状況報告書
    • 査読あり
  • [雑誌論文] An Ensemble Learning Method of Adaptive Structural Deep Belief Network for AffectNet2022

    • 著者名/発表者名
      Takumi Ichimura, Shin Kamada
    • 雑誌名

      International Journal of Smart Computing and Artificial Intelligence

      巻: 6 号: 1 ページ: 1

    • DOI

      10.52731/ijscai.v6.i1.640

    • ISSN
      2185-9906, 2185-9914
    • 関連する報告書
      2021 実施状況報告書
    • 査読あり / オープンアクセス
  • [学会発表] マルチモーダル構造適応型深層学習によるRVDESSデータセットの感情分類2024

    • 著者名/発表者名
      鎌田真,市村匠
    • 学会等名
      計測自動制御学会第51回知能システムシンポジウム,pp.152-157
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] A Segmentation Method of Lung Tumor by using Adaptive Structural Deep Belief Network2023

    • 著者名/発表者名
      Shin Kamada, Takumi Ichimura
    • 学会等名
      Proc. of The SICE Annual Conference 2023 (SICE 2023), pp.1529-1534
    • 関連する報告書
      2023 実施状況報告書
    • 国際学会
  • [学会発表] 構造適応型深層学習を用いた肺腫瘍セグメンテーション手法の開発2022

    • 著者名/発表者名
      鎌田真,市村匠,河原大輔
    • 学会等名
      計測自動制御学会第21回コンピューテーショナル・インテリジェンス研究会,pp.1-5
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] Teacher-Student型構造適応型深層学習モデルにおける複数GPU計算機の自動計算2022

    • 著者名/発表者名
      市村匠,鎌田真
    • 学会等名
      2022 IEEE SMC Hiroshima Chapter Young Researchers WorkShop,pp.69-73
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] Automatic Extraction of Road Networks from Satellite Images by using Adaptive Structural Deep Belief Network2021

    • 著者名/発表者名
      Shin Kamada, Takumi Ichimura
    • 学会等名
      Proc. of 10th International Conference on Informatics, Electronics & Vision (ICIEV 2021), paper 37
    • 関連する報告書
      2021 実施状況報告書
    • 国際学会
  • [学会発表] 構造適応型深層学習を用いた道路網認識手法RoadTracerによる土砂検出の試み2021

    • 著者名/発表者名
      鎌田真,市村匠
    • 学会等名
      インテリジェント・システム・シンポジウム2021 (FAN2021),pp.181-186
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] Teacher-Student構造適応型深層学習によるアンサンブル学習と認知症MRI画像診断への応用2021

    • 著者名/発表者名
      鎌田真,市村匠,原田俊英
    • 学会等名
      2021 IEEE SMC Hiroshima Chapter Young Researchers WorkShop,pp.30-35
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] 構造適応型深層学習法によるRoadTracerの道路検出に対する一考察2021

    • 著者名/発表者名
      市村匠,鎌田真
    • 学会等名
      2021 IEEE SMC Hiroshima Chapter Young Researchers WorkShop,pp.16-23
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] Teacher-Student構造適応型深層学習によるアンサンブル学習と認知症MRI画像診断への応用2021

    • 著者名/発表者名
      市村匠,鎌田真,原田俊英,井上健
    • 学会等名
      第33回日本老年医学会 中国地方会, No.23
    • 関連する報告書
      2021 実施状況報告書
    • 招待講演

URL: 

公開日: 2021-04-28   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi