研究課題/領域番号 |
21K17809
|
研究機関 | 広島市立大学 |
研究代表者 |
鎌田 真 広島市立大学, 情報科学研究科, 准教授 (30845178)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
キーワード | 深層学習 / マルチモーダル / 構造適応型学習 / 知識獲得 / ビッグデータ |
研究実績の概要 |
入力データに対して適応的に隠れニューロン数や層の数を自動で生成/消去する構造適応型深層学習法を開発した。本手法は画像や時系列データ等のベンチマークにおいて,他の深層学習手法(VGG16, ResNet等)より高い分類能力を示した。本手法は既存の手法よりも高い性能を示したものの,数は多くないが,分類困難な事例が見つかっている。これらの多くは,医療データ等に見られる曖昧性が多く含まれる事例や,単一のデータだけ判定が難しいものであった。 深層学習では,複数の異なる入力を同時に学習するマルチモーダル深層学習は提案されているが,各モダリティ間の特徴や知識表現に基づき,最終判定のために適切に合成・融合する手法は少ない。このため,本研究では,動画像,音声,自然言語等の複数のモダリティを入力とし,個別のモデルとして並列的に処理し,モダリティ間の関係性を考慮した上で合成し,最終的な出力判定を行うマルチモーダル構造適応型深層学習を探求する。特に,複数のモデル間の確率分布の違いをKL情報量により測定し,モダリティを適切に合成・融合するための指標を開発する。類似性に応じてモダリティ間の共通成分を知識として獲得し,データ表現能力が不足する場合は新規ニューロンを自動追加する。入力に欠損があった場合でも別のモダリティがもつ知識に基づいて補間し,その他の情報と合成することで人間のような高次の情報処理を実現する。動画等のビッグデータに適用し評価する。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
2022年度では,マルチモーダル深層学習として,親モデルと複数の子モデルを用いたTeacher-Student構造適応型深層学習法の改良を行った。入力データに含まれる多様な特徴を親モデルと複数の子モデルで学習し,KL情報をもとに,子モデルに蓄積されている特徴や知識表現を親に転移させることで,分類性能の向上を実現した。開発したモデルを複数のデータセットに適用し,手法の評価を行った。具体的には,MRI/PET画像に適用し,認知症早期判定のための深層学習システムを開発した。また,航空写真とグラフ探索に基づき,道路網地図を自動検出するRoadTracerに適用し,既存の手法よりも高い性能を示し,論文投稿を行った(査読中)。 さらに,マルチモーダル深層学習として,多様なデータを学習可能にするため,構造適応型深層学習法におけるセグメンテーション手法を開発した。以前の研究で提案した学習済み深層学習における知識獲得手法に基づき,中間層で得られた特徴パタンから,入力画像における物体の可能性をヒートマップとして可視化し,出力する手法を開発した。公開されている肺の3次元CT画像を用いて,腫瘍領域を自動で抽出するセグメンテーションタスクに適用したところ,既存の手法より高い性能が得られた。一方,2022年度に予定していた自然言語処理の開発等,一部の実験は実施できなかった。これらの研究については,来年度に延期する。これにより,「やや遅れている」とした。
|
今後の研究の推進方策 |
2023年度では,2022年度に実施できなかった実験を行い,提案手法の精度改善を目指す。具体的には,多様なマルチモーダル深層学習の開発のため,構造適応型深層学習における音声・自然言語処理モデルを新たに開発する。さらに,学習後のマルチモーダル深層学習から,各モダリティ間の特徴や共通成分を知識として獲得する。学習後のNNモデルはブラックボックスと言われているが,RBM及びDBNはニューロンが2値のパタンで表現されているため,入力から出力までの信号の流れを解析する。これらについて,オープンビッグデータを用いて検証する。
|
次年度使用額が生じた理由 |
2022年度では,新型コロナウイルスの影響により,旅費に関するを経費をほとんど執行できなかった。2023年度では,収束傾向になることが見込まれるものの,不確定な要素も多いため,その時点の状況を考えながら,学会発表,論文発表等で成果を報告する。また,研究のスピードアップを図るため,GPUの購入,実験の補助として学生アルバイトを雇う。
|