• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

深層学習の潜在変数の解析とその構成法の検討

研究課題

研究課題/領域番号 23K11266
研究種目

基盤研究(C)

配分区分基金
応募区分一般
審査区分 小区分61040:ソフトコンピューティング関連
研究機関東京都市大学

研究代表者

神野 健哉  東京都市大学, 情報工学部, 教授 (50286762)

研究期間 (年度) 2023-04-01 – 2026-03-31
研究課題ステータス 交付 (2023年度)
配分額 *注記
4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)
2025年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2024年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2023年度: 2,340千円 (直接経費: 1,800千円、間接経費: 540千円)
キーワード深層学習 / 潜在変数 / マルチモーダル / 表現学習 / 特徴抽出
研究開始時の研究の概要

本研究の目的は「深層学習における潜在変数の質を解析し、モダリティに依らないより高品質な潜在変数の構成法を検討すること」である。
深層学習モデルは大量の高次元データを対象とした複雑な問題の学習が可能である。深層学習は様々なモダリティの入力に対して活用されており、その特徴量の抽出は表現学習と呼ばれる。これまでの深層学習では出力データの品質を良くすることに重きが置かれ、潜在変数が表現する情報の質に関する検討はあまりされていない。そこで潜在変数から出力を生成するデコーダを用いて潜在変数の各次元の役割を明らかにすることをまずは行う。その上で出力の品質を向上させる潜在変数について検討を行う。

研究実績の概要

本研究課題では深層学習における潜在変数の質を解析し、モダリティに依らない高品質な潜在変数の構成法を検討することが目的である。そのような潜在変数を得るための学習方法、また得られた潜在変数を活用したシステムの開発も目的であり、2023年度は以下の点に着目し研究を実施した。 (1) 大規模自然言語処理システムに文章を与えた際に得られる潜在変数の性質を確認するために、日本語コンテンツで事前学習されたSentence-BERTをEncoderとみなし入力文章を潜在変数に変換した。この潜在変数の性質を可視化するため、この潜在変数から入力文章に対応した画像を生成することが可能なDecoderを設計した。このDecoderで生成される画像を用いて、潜在変数空間内に特定形状の物体の色を表す超平面が存在すること、物体形状を表す超平面が存在することを明らかにした。 (2) 画像が形、色、テクスチャでそれぞれ分類されるような場合に潜在変数の分布がどのようになるかを実験的に解析した。その結果、画像によって形状、色空間で潜在変数空間にクラスターが生成されることを明らかにした。 (3) U-Netを基本とした画像変換タスクを実現するEncoder-Decoderモデルを提案し、それぞれの深さでのスキップ接続がどのような情報伝達を行なっているのかを実験的に明らかにした。 (4) 潜在変数の分布を評価関数に用いて性能の良い人工ニューラルネットワーク構成を検討することができるかについて解析を行った。その結果、学習初期の状態から学習後の性能を予測できることを明らかにした。また潜在変数の評価関数の構成法についても検討を行い、新たな評価指標の創出を目指した。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

当初の計画通りに研究を実施できている。

今後の研究の推進方策

2024年度は前年度に引き続き深層学習における潜在変数の質を解析し、モダリティに依らない高品質な潜在変数の構成法を検討する。
そのため、画像とその画像を説明した文章の潜在変数がモダリティによらず類似した変数にできるかについて検討を行う。それぞれのモダリティに対応したエンコーダを用意し、モダリティは異なっても対象が同一である場合にそれらの潜在変数間の距離が近くなるように、対象が異なる場合にはそれらの潜在変数間の距離が離れるようにエンコーダの学習を行うことを考える。このような学習で得られる潜在変数と同一モダリティでSiamese Networkを用いて対照学習を行なった場合で得られる潜在変数との比較をするなどして、潜在変数の性質を検討する。またこのような方法で生成された潜在変数が分類タスクやデータ生成タスクに対して有用であるかの実験、考察を行う。また潜在変数が伝達する情報についても引き続き解析を行う。さらに潜在変数空間でネットワークの性能を評価できるようにし、任意のタスクに対して性能の良い構造を有した人工ニューラルネットワークの探索を目的としたNetwork Architecture Search (NAS)に応用し、従来のNASよりも高速・高精度にネットワークの性能を評価できるシステムの開発を目指す。

報告書

(1件)
  • 2023 実施状況報告書
  • 研究成果

    (24件)

すべて 2023

すべて 雑誌論文 (5件) (うち査読あり 5件、 オープンアクセス 5件) 学会発表 (19件) (うち国際学会 6件)

  • [雑誌論文] Zero-Shot Evaluation Index Based on Robustness of CNN Output2023

    • 著者名/発表者名
      Takahashi Chisato、Jin'no Kenya
    • 雑誌名

      信号処理

      巻: 27 号: 4 ページ: 65-68

    • DOI

      10.2299/jsp.27.65

    • ISSN
      1342-6230, 1880-1013
    • 年月日
      2023-07-01
    • 関連する報告書
      2023 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Learning a simple multilayer perceptron with PSO2023

    • 著者名/発表者名
      Takato Riku、Jin'no Kenya
    • 雑誌名

      Nonlinear Theory and Its Applications, IEICE

      巻: 14 号: 2 ページ: 500-507

    • DOI

      10.1587/nolta.14.500

    • ISSN
      2185-4106
    • 関連する報告書
      2023 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Feature analysis of sentence vectors by an image-generation model using Sentence-BERT2023

    • 著者名/発表者名
      Izumi Masato、Jin'no Kenya
    • 雑誌名

      Nonlinear Theory and Its Applications, IEICE

      巻: 14 号: 2 ページ: 508-519

    • DOI

      10.1587/nolta.14.508

    • ISSN
      2185-4106
    • 関連する報告書
      2023 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Fundamental Considerations on Representation Learning for Multimodal Processing2023

    • 著者名/発表者名
      Jin'no Kenya、Izumi Masato、Okamoto Saki、Dai Mizuki、Takahashi Chisato、Inami Tatsuro
    • 雑誌名

      Human Interface and the Management of Information, LNCS14015

      巻: 1 ページ: 389-399

    • DOI

      10.1007/978-3-031-35132-7_29

    • ISBN
      9783031351310, 9783031351327
    • 関連する報告書
      2023 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] A study on the role of latent variables in the encoder-decoder model using image datasets2023

    • 著者名/発表者名
      Okamoto Saki、Jin'no Kenya
    • 雑誌名

      Nonlinear Theory and Its Applications, IEICE

      巻: 14 号: 4 ページ: 652-676

    • DOI

      10.1587/nolta.14.652

    • ISSN
      2185-4106
    • 関連する報告書
      2023 実施状況報告書
    • 査読あり / オープンアクセス
  • [学会発表] Fundamental Considerations on Representation Learning for Multimodal Processing2023

    • 著者名/発表者名
      Kenya Jin'no, Masato Izumi, Saki Okamoto, Mizuki Dai, Chisato Takahashi, Tatsuro Inami
    • 学会等名
      HCI International 2023, 25TH International Conference on Human-Computer Interaction (HCII2023)
    • 関連する報告書
      2023 実施状況報告書
    • 国際学会
  • [学会発表] A Consideration of Information Education with Python2023

    • 著者名/発表者名
      Kenya Jin'no
    • 学会等名
      2023 International Conference of Nonlinear Theory and its Applications (NOLTA 2023)
    • 関連する報告書
      2023 実施状況報告書
    • 国際学会
  • [学会発表] Predicting Classification Performance of Convolutional Neural Networks2023

    • 著者名/発表者名
      Mizuki Dai, Kenya Jin'no
    • 学会等名
      2023 International Conference of Nonlinear Theory and its Applications (NOLTA 2023)
    • 関連する報告書
      2023 実施状況報告書
    • 国際学会
  • [学会発表] Recognition of Shape in Rotation Transformations of Stereoscopic Images2023

    • 著者名/発表者名
      Saki Okamoto, Kenya Jin'no
    • 学会等名
      2023 International Conference of Nonlinear Theory and its Applications (NOLTA 2023)
    • 関連する報告書
      2023 実施状況報告書
    • 国際学会
  • [学会発表] Investigation of relationships within the latent variable space of Sentence-BERT sentence vectors2023

    • 著者名/発表者名
      Masato Izumi, Kenya Jin'no
    • 学会等名
      2023 International Conference of Nonlinear Theory and its Applications (NOLTA 2023)
    • 関連する報告書
      2023 実施状況報告書
    • 国際学会
  • [学会発表] Investigation on the features extracted by CNN kernels from images2023

    • 著者名/発表者名
      Sora Togawa, Kenya Jin'no
    • 学会等名
      2023 International Conference of Nonlinear Theory and its Applications (NOLTA 2023)
    • 関連する報告書
      2023 実施状況報告書
    • 国際学会
  • [学会発表] 画像生成モデルを用いたSentence-BERTの文ベクトルの調査2023

    • 著者名/発表者名
      泉 諒音, 神野 健哉
    • 学会等名
      2023年度 人工知能学会 全国大会 (JSAI2023)
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] CNNを用いた画像分類における分類精度の予測2023

    • 著者名/発表者名
      代 美月, 神野 健哉
    • 学会等名
      2023年度 人工知能学会 全国大会 (JSAI2023)
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] 画像データセットを用いた潜在変数の役割の検討2023

    • 著者名/発表者名
      岡本 紗季, 神野 健哉
    • 学会等名
      2023年度 人工知能学会 全国大会 (JSAI2023)
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] 新たなZero-shot NN評価指標の提案に向けた検討2023

    • 著者名/発表者名
      高橋 知里, 神野 健哉
    • 学会等名
      2023年度 人工知能学会 全国大会 (JSAI2023)
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] Differential Evolutionによる簡素なニューラルネットワークの学習2023

    • 著者名/発表者名
      武次 豪士, 神野 健哉
    • 学会等名
      2023年 電子情報通信学会 NOLTAソサイエティ大会
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] CNNによる主観的輪郭線の認識2023

    • 著者名/発表者名
      小川 航平, 神野 健哉
    • 学会等名
      2023年 電子情報通信学会 NOLTAソサイエティ大会
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] 深層強化学習を用いたCNNにおける畳み込み層のチャネル数の探索2023

    • 著者名/発表者名
      遠田 海生, 神野 健哉
    • 学会等名
      2023年 電子情報通信学会 NOLTAソサイエティ大会
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] Pruning によるAutoEncorder の重み初期値の影響の検討2023

    • 著者名/発表者名
      井波 辰朗, 神野 健哉
    • 学会等名
      2023年 電子情報通信学会 NOLTAソサイエティ大会
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] Sentence-BERTの文ベクトルの潜在変数空間内での関係性の検討2023

    • 著者名/発表者名
      泉 諒音, 神野 健哉
    • 学会等名
      2023年 電子情報通信学会 NOLTAソサイエティ大会
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] encoder-decoderモデルに与える色の影響に関する検討2023

    • 著者名/発表者名
      岡本 紗季, 神野 健哉
    • 学会等名
      2023年 電子情報通信学会 NOLTAソサイエティ大会
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] 重回帰分析を用いたCNN分類精度の予測2023

    • 著者名/発表者名
      代 美月, 神野 健哉
    • 学会等名
      2023年 電子情報通信学会 NOLTAソサイエティ大会
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] 対照学習による色と形の認識2023

    • 著者名/発表者名
      若狭 春輝, 神野 健哉
    • 学会等名
      2023年 電子情報通信学会 NOLTAソサイエティ大会
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] 画像分類におけるCNNの学習の特徴に関する検討2023

    • 著者名/発表者名
      外川 宙, 神野 健哉
    • 学会等名
      2023年 電子情報通信学会 NOLTAソサイエティ大会
    • 関連する報告書
      2023 実施状況報告書

URL: 

公開日: 2023-04-13   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi