• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Analysis of latent variables in deep learning and their compositional methods

Research Project

Project/Area Number 23K11266
Research Category

Grant-in-Aid for Scientific Research (C)

Allocation TypeMulti-year Fund
Section一般
Review Section Basic Section 61040:Soft computing-related
Research InstitutionTokyo City University

Principal Investigator

神野 健哉  東京都市大学, 情報工学部, 教授 (50286762)

Project Period (FY) 2023-04-01 – 2026-03-31
Project Status Granted (Fiscal Year 2023)
Budget Amount *help
¥4,680,000 (Direct Cost: ¥3,600,000、Indirect Cost: ¥1,080,000)
Fiscal Year 2025: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2024: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2023: ¥2,340,000 (Direct Cost: ¥1,800,000、Indirect Cost: ¥540,000)
Keywords深層学習 / 潜在変数 / マルチモーダル / 表現学習 / 特徴抽出
Outline of Research at the Start

本研究の目的は「深層学習における潜在変数の質を解析し、モダリティに依らないより高品質な潜在変数の構成法を検討すること」である。
深層学習モデルは大量の高次元データを対象とした複雑な問題の学習が可能である。深層学習は様々なモダリティの入力に対して活用されており、その特徴量の抽出は表現学習と呼ばれる。これまでの深層学習では出力データの品質を良くすることに重きが置かれ、潜在変数が表現する情報の質に関する検討はあまりされていない。そこで潜在変数から出力を生成するデコーダを用いて潜在変数の各次元の役割を明らかにすることをまずは行う。その上で出力の品質を向上させる潜在変数について検討を行う。

Outline of Annual Research Achievements

本研究課題では深層学習における潜在変数の質を解析し、モダリティに依らない高品質な潜在変数の構成法を検討することが目的である。そのような潜在変数を得るための学習方法、また得られた潜在変数を活用したシステムの開発も目的であり、2023年度は以下の点に着目し研究を実施した。 (1) 大規模自然言語処理システムに文章を与えた際に得られる潜在変数の性質を確認するために、日本語コンテンツで事前学習されたSentence-BERTをEncoderとみなし入力文章を潜在変数に変換した。この潜在変数の性質を可視化するため、この潜在変数から入力文章に対応した画像を生成することが可能なDecoderを設計した。このDecoderで生成される画像を用いて、潜在変数空間内に特定形状の物体の色を表す超平面が存在すること、物体形状を表す超平面が存在することを明らかにした。 (2) 画像が形、色、テクスチャでそれぞれ分類されるような場合に潜在変数の分布がどのようになるかを実験的に解析した。その結果、画像によって形状、色空間で潜在変数空間にクラスターが生成されることを明らかにした。 (3) U-Netを基本とした画像変換タスクを実現するEncoder-Decoderモデルを提案し、それぞれの深さでのスキップ接続がどのような情報伝達を行なっているのかを実験的に明らかにした。 (4) 潜在変数の分布を評価関数に用いて性能の良い人工ニューラルネットワーク構成を検討することができるかについて解析を行った。その結果、学習初期の状態から学習後の性能を予測できることを明らかにした。また潜在変数の評価関数の構成法についても検討を行い、新たな評価指標の創出を目指した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

当初の計画通りに研究を実施できている。

Strategy for Future Research Activity

2024年度は前年度に引き続き深層学習における潜在変数の質を解析し、モダリティに依らない高品質な潜在変数の構成法を検討する。
そのため、画像とその画像を説明した文章の潜在変数がモダリティによらず類似した変数にできるかについて検討を行う。それぞれのモダリティに対応したエンコーダを用意し、モダリティは異なっても対象が同一である場合にそれらの潜在変数間の距離が近くなるように、対象が異なる場合にはそれらの潜在変数間の距離が離れるようにエンコーダの学習を行うことを考える。このような学習で得られる潜在変数と同一モダリティでSiamese Networkを用いて対照学習を行なった場合で得られる潜在変数との比較をするなどして、潜在変数の性質を検討する。またこのような方法で生成された潜在変数が分類タスクやデータ生成タスクに対して有用であるかの実験、考察を行う。また潜在変数が伝達する情報についても引き続き解析を行う。さらに潜在変数空間でネットワークの性能を評価できるようにし、任意のタスクに対して性能の良い構造を有した人工ニューラルネットワークの探索を目的としたNetwork Architecture Search (NAS)に応用し、従来のNASよりも高速・高精度にネットワークの性能を評価できるシステムの開発を目指す。

Report

(1 results)
  • 2023 Research-status Report
  • Research Products

    (24 results)

All 2023

All Journal Article (5 results) (of which Peer Reviewed: 5 results,  Open Access: 5 results) Presentation (19 results) (of which Int'l Joint Research: 6 results)

  • [Journal Article] Zero-Shot Evaluation Index Based on Robustness of CNN Output2023

    • Author(s)
      Takahashi Chisato、Jin'no Kenya
    • Journal Title

      Journal of Signal Processing

      Volume: 27 Issue: 4 Pages: 65-68

    • DOI

      10.2299/jsp.27.65

    • ISSN
      1342-6230, 1880-1013
    • Year and Date
      2023-07-01
    • Related Report
      2023 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] Learning a simple multilayer perceptron with PSO2023

    • Author(s)
      Takato Riku、Jin'no Kenya
    • Journal Title

      Nonlinear Theory and Its Applications, IEICE

      Volume: 14 Issue: 2 Pages: 500-507

    • DOI

      10.1587/nolta.14.500

    • ISSN
      2185-4106
    • Related Report
      2023 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] Feature analysis of sentence vectors by an image-generation model using Sentence-BERT2023

    • Author(s)
      Izumi Masato、Jin'no Kenya
    • Journal Title

      Nonlinear Theory and Its Applications, IEICE

      Volume: 14 Issue: 2 Pages: 508-519

    • DOI

      10.1587/nolta.14.508

    • ISSN
      2185-4106
    • Related Report
      2023 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] Fundamental Considerations on Representation Learning for Multimodal Processing2023

    • Author(s)
      Jin'no Kenya、Izumi Masato、Okamoto Saki、Dai Mizuki、Takahashi Chisato、Inami Tatsuro
    • Journal Title

      Human Interface and the Management of Information, LNCS14015

      Volume: 1 Pages: 389-399

    • DOI

      10.1007/978-3-031-35132-7_29

    • ISBN
      9783031351310, 9783031351327
    • Related Report
      2023 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] A study on the role of latent variables in the encoder-decoder model using image datasets2023

    • Author(s)
      Okamoto Saki、Jin'no Kenya
    • Journal Title

      Nonlinear Theory and Its Applications, IEICE

      Volume: 14 Issue: 4 Pages: 652-676

    • DOI

      10.1587/nolta.14.652

    • ISSN
      2185-4106
    • Related Report
      2023 Research-status Report
    • Peer Reviewed / Open Access
  • [Presentation] Fundamental Considerations on Representation Learning for Multimodal Processing2023

    • Author(s)
      Kenya Jin'no, Masato Izumi, Saki Okamoto, Mizuki Dai, Chisato Takahashi, Tatsuro Inami
    • Organizer
      HCI International 2023, 25TH International Conference on Human-Computer Interaction (HCII2023)
    • Related Report
      2023 Research-status Report
    • Int'l Joint Research
  • [Presentation] A Consideration of Information Education with Python2023

    • Author(s)
      Kenya Jin'no
    • Organizer
      2023 International Conference of Nonlinear Theory and its Applications (NOLTA 2023)
    • Related Report
      2023 Research-status Report
    • Int'l Joint Research
  • [Presentation] Predicting Classification Performance of Convolutional Neural Networks2023

    • Author(s)
      Mizuki Dai, Kenya Jin'no
    • Organizer
      2023 International Conference of Nonlinear Theory and its Applications (NOLTA 2023)
    • Related Report
      2023 Research-status Report
    • Int'l Joint Research
  • [Presentation] Recognition of Shape in Rotation Transformations of Stereoscopic Images2023

    • Author(s)
      Saki Okamoto, Kenya Jin'no
    • Organizer
      2023 International Conference of Nonlinear Theory and its Applications (NOLTA 2023)
    • Related Report
      2023 Research-status Report
    • Int'l Joint Research
  • [Presentation] Investigation of relationships within the latent variable space of Sentence-BERT sentence vectors2023

    • Author(s)
      Masato Izumi, Kenya Jin'no
    • Organizer
      2023 International Conference of Nonlinear Theory and its Applications (NOLTA 2023)
    • Related Report
      2023 Research-status Report
    • Int'l Joint Research
  • [Presentation] Investigation on the features extracted by CNN kernels from images2023

    • Author(s)
      Sora Togawa, Kenya Jin'no
    • Organizer
      2023 International Conference of Nonlinear Theory and its Applications (NOLTA 2023)
    • Related Report
      2023 Research-status Report
    • Int'l Joint Research
  • [Presentation] 画像生成モデルを用いたSentence-BERTの文ベクトルの調査2023

    • Author(s)
      泉 諒音, 神野 健哉
    • Organizer
      2023年度 人工知能学会 全国大会 (JSAI2023)
    • Related Report
      2023 Research-status Report
  • [Presentation] CNNを用いた画像分類における分類精度の予測2023

    • Author(s)
      代 美月, 神野 健哉
    • Organizer
      2023年度 人工知能学会 全国大会 (JSAI2023)
    • Related Report
      2023 Research-status Report
  • [Presentation] 画像データセットを用いた潜在変数の役割の検討2023

    • Author(s)
      岡本 紗季, 神野 健哉
    • Organizer
      2023年度 人工知能学会 全国大会 (JSAI2023)
    • Related Report
      2023 Research-status Report
  • [Presentation] 新たなZero-shot NN評価指標の提案に向けた検討2023

    • Author(s)
      高橋 知里, 神野 健哉
    • Organizer
      2023年度 人工知能学会 全国大会 (JSAI2023)
    • Related Report
      2023 Research-status Report
  • [Presentation] Differential Evolutionによる簡素なニューラルネットワークの学習2023

    • Author(s)
      武次 豪士, 神野 健哉
    • Organizer
      2023年 電子情報通信学会 NOLTAソサイエティ大会
    • Related Report
      2023 Research-status Report
  • [Presentation] CNNによる主観的輪郭線の認識2023

    • Author(s)
      小川 航平, 神野 健哉
    • Organizer
      2023年 電子情報通信学会 NOLTAソサイエティ大会
    • Related Report
      2023 Research-status Report
  • [Presentation] 深層強化学習を用いたCNNにおける畳み込み層のチャネル数の探索2023

    • Author(s)
      遠田 海生, 神野 健哉
    • Organizer
      2023年 電子情報通信学会 NOLTAソサイエティ大会
    • Related Report
      2023 Research-status Report
  • [Presentation] Pruning によるAutoEncorder の重み初期値の影響の検討2023

    • Author(s)
      井波 辰朗, 神野 健哉
    • Organizer
      2023年 電子情報通信学会 NOLTAソサイエティ大会
    • Related Report
      2023 Research-status Report
  • [Presentation] Sentence-BERTの文ベクトルの潜在変数空間内での関係性の検討2023

    • Author(s)
      泉 諒音, 神野 健哉
    • Organizer
      2023年 電子情報通信学会 NOLTAソサイエティ大会
    • Related Report
      2023 Research-status Report
  • [Presentation] encoder-decoderモデルに与える色の影響に関する検討2023

    • Author(s)
      岡本 紗季, 神野 健哉
    • Organizer
      2023年 電子情報通信学会 NOLTAソサイエティ大会
    • Related Report
      2023 Research-status Report
  • [Presentation] 重回帰分析を用いたCNN分類精度の予測2023

    • Author(s)
      代 美月, 神野 健哉
    • Organizer
      2023年 電子情報通信学会 NOLTAソサイエティ大会
    • Related Report
      2023 Research-status Report
  • [Presentation] 対照学習による色と形の認識2023

    • Author(s)
      若狭 春輝, 神野 健哉
    • Organizer
      2023年 電子情報通信学会 NOLTAソサイエティ大会
    • Related Report
      2023 Research-status Report
  • [Presentation] 画像分類におけるCNNの学習の特徴に関する検討2023

    • Author(s)
      外川 宙, 神野 健哉
    • Organizer
      2023年 電子情報通信学会 NOLTAソサイエティ大会
    • Related Report
      2023 Research-status Report

URL: 

Published: 2023-04-13   Modified: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi