2022 年度実施状況報告書

複数モダリティの知識表現を用いたマルチモーダル構造適応型深層学習の研究

研究課題

研究課題/領域番号	21K17809
研究機関	広島市立大学
研究代表者	鎌田真広島市立大学, 情報科学研究科, 准教授 (30845178)
研究期間 (年度)	2021-04-01 – 2024-03-31
キーワード	深層学習 / マルチモーダル / 構造適応型学習 / 知識獲得 / ビッグデータ
研究実績の概要	入力データに対して適応的に隠れニューロン数や層の数を自動で生成／消去する構造適応型深層学習法を開発した。本手法は画像や時系列データ等のベンチマークにおいて，他の深層学習手法(VGG16, ResNet等)より高い分類能力を示した。本手法は既存の手法よりも高い性能を示したものの，数は多くないが，分類困難な事例が見つかっている。これらの多くは，医療データ等に見られる曖昧性が多く含まれる事例や，単一のデータだけ判定が難しいものであった。深層学習では，複数の異なる入力を同時に学習するマルチモーダル深層学習は提案されているが，各モダリティ間の特徴や知識表現に基づき，最終判定のために適切に合成・融合する手法は少ない。このため，本研究では，動画像，音声，自然言語等の複数のモダリティを入力とし，個別のモデルとして並列的に処理し，モダリティ間の関係性を考慮した上で合成し，最終的な出力判定を行うマルチモーダル構造適応型深層学習を探求する。特に，複数のモデル間の確率分布の違いをKL情報量により測定し，モダリティを適切に合成・融合するための指標を開発する。類似性に応じてモダリティ間の共通成分を知識として獲得し，データ表現能力が不足する場合は新規ニューロンを自動追加する。入力に欠損があった場合でも別のモダリティがもつ知識に基づいて補間し，その他の情報と合成することで人間のような高次の情報処理を実現する。動画等のビッグデータに適用し評価する。
現在までの達成度 (区分)	現在までの達成度 (区分) 3: やや遅れている理由 2022年度では，マルチモーダル深層学習として，親モデルと複数の子モデルを用いたTeacher-Student構造適応型深層学習法の改良を行った。入力データに含まれる多様な特徴を親モデルと複数の子モデルで学習し，KL情報をもとに，子モデルに蓄積されている特徴や知識表現を親に転移させることで，分類性能の向上を実現した。開発したモデルを複数のデータセットに適用し，手法の評価を行った。具体的には，MRI/PET画像に適用し，認知症早期判定のための深層学習システムを開発した。また，航空写真とグラフ探索に基づき，道路網地図を自動検出するRoadTracerに適用し，既存の手法よりも高い性能を示し，論文投稿を行った(査読中)。さらに，マルチモーダル深層学習として，多様なデータを学習可能にするため，構造適応型深層学習法におけるセグメンテーション手法を開発した。以前の研究で提案した学習済み深層学習における知識獲得手法に基づき，中間層で得られた特徴パタンから，入力画像における物体の可能性をヒートマップとして可視化し，出力する手法を開発した。公開されている肺の3次元CT画像を用いて，腫瘍領域を自動で抽出するセグメンテーションタスクに適用したところ，既存の手法より高い性能が得られた。一方，2022年度に予定していた自然言語処理の開発等，一部の実験は実施できなかった。これらの研究については，来年度に延期する。これにより，「やや遅れている」とした。
今後の研究の推進方策	2023年度では，2022年度に実施できなかった実験を行い，提案手法の精度改善を目指す。具体的には，多様なマルチモーダル深層学習の開発のため，構造適応型深層学習における音声・自然言語処理モデルを新たに開発する。さらに，学習後のマルチモーダル深層学習から，各モダリティ間の特徴や共通成分を知識として獲得する。学習後のNNモデルはブラックボックスと言われているが，RBM及びDBNはニューロンが2値のパタンで表現されているため，入力から出力までの信号の流れを解析する。これらについて，オープンビッグデータを用いて検証する。
次年度使用額が生じた理由	2022年度では，新型コロナウイルスの影響により，旅費に関するを経費をほとんど執行できなかった。2023年度では，収束傾向になることが見込まれるものの，不確定な要素も多いため，その時点の状況を考えながら，学会発表，論文発表等で成果を報告する。また，研究のスピードアップを図るため，GPUの購入，実験の補助として学生アルバイトを雇う。

研究成果
(3件)

すべて 2023 2022

すべて雑誌論文 (1件) (うち査読あり 1件) 学会発表 (2件)

[雑誌論文] A Teacher-Student based Adaptive Structural Deep learning Model and Its Estimating Uncertainty of Image Data2023
- 著者名/発表者名
  Takumi Ichimura, Shin Kamada, Toshihide Harada and Ken Inoue
- 雑誌名
  
  Handbook of Statistics Volume 49: Artificial Intelligence
  
  巻: 49 ページ: -
- 査読あり
[学会発表] 構造適応型深層学習を用いた肺腫瘍セグメンテーション手法の開発2022
- 著者名/発表者名
  鎌田真，市村匠，河原大輔
- 学会等名
  計測自動制御学会第21回コンピューテーショナル・インテリジェンス研究会，pp.1-5
[学会発表] Teacher-Student型構造適応型深層学習モデルにおける複数GPU計算機の自動計算2022
- 著者名/発表者名
  市村匠，鎌田真
- 学会等名
  2022 IEEE SMC Hiroshima Chapter Young Researchers WorkShop，pp.69-73

2022 年度 実施状況報告書

複数モダリティの知識表現を用いたマルチモーダル構造適応型深層学習の研究

研究代表者

鎌田 真 広島市立大学, 情報科学研究科, 准教授 (30845178)

現在までの達成度 (区分)

理由

研究成果

[雑誌論文] A Teacher-Student based Adaptive Structural Deep learning Model and Its Estimating Uncertainty of Image Data2023

著者名/発表者名

雑誌名

[学会発表] 構造適応型深層学習を用いた肺腫瘍セグメンテーション手法の開発2022

著者名/発表者名

学会等名

[学会発表] Teacher-Student型構造適応型深層学習モデルにおける複数GPU計算機の自動計算2022

著者名/発表者名

学会等名

2022 年度実施状況報告書

鎌田真広島市立大学, 情報科学研究科, 准教授 (30845178)