深層ニューラルネットワークを用いた高精度で効率的な確率推論法の開発と応用

研究課題

研究課題/領域番号	22KJ0679
補助金の研究課題番号	21J22342 (2021-2022)
研究種目	特別研究員奨励費
配分区分	基金 (2023) 補助金 (2021-2022)
応募区分	国内
審査区分	小区分61030:知能情報学関連
研究機関	東京大学
研究代表者	谷口尚平東京大学, 工学系研究科, 特別研究員(DC1)
研究期間 (年度)	2023-03-08 – 2024-03-31
研究課題ステータス	完了 (2023年度)
配分額 *注記	2,200千円 (直接経費: 2,200千円) 2023年度: 700千円 (直接経費: 700千円) 2022年度: 700千円 (直接経費: 700千円) 2021年度: 800千円 (直接経費: 800千円)
キーワード	深層ボルツマンマシン / 確率的最適化 / 償却ランジュバン動力学法 / 不偏推定 / マルコフ連鎖モンテカルロ法 / 深層生成モデル
研究開始時の研究の概要	深層学習に代表されるような大規模で複雑な統計モデルの応用を進めるためには、統計モデルに含まれる大量のパラメータを効率よく推論するための技術が不可欠である。本研究では特に、深層ニューラルネットワークを活用した償却推論と呼ばれる技術を用いて、潜在変数モデルや強化学習における統計モデルの推論を効率よく行うための手法の開発を行う。この研究は、深層学習のような大規模なモデルを実世界応用にスケールさせるための重要な基礎技術となることが期待される。
研究実績の概要	令和5年7月に深層ボルツマンマシンの不偏勾配推定に関する研究を機械学習系の国際会議であるInternational Conference on Machine Learning (ICML2023) にて発表し，論文が会議録として出版された．また，同内容を第37回人工知能学会全国大会においても発表した．その後は，深層生成モデルを含む深層学習モデル一般の学習において用いられる確率的最適化アルゴリズムに関する研究を行った．具体的には，深層学習において最も広く用いられる最適化アルゴリズムの1つであるadoptive moment estimation (Adam) を取り上げ，その収束性について解析を行った．Adamは先行研究において，収束に失敗する事例が存在することが知られていたが，そのような事例が起こりうる原因について，理論解析を通じて明らかにし，その原因を取り除くことのできる新しい最適化アルゴリズムとして，adaptive gradient method with optimal rate (ADOPT) を提案した．この成果をまとめた論文は，深層学習分野の国際会議であるInternational Conference on Learning Representation (ICLR2024) のワークショップとして開催されるWorkshop on Bridging the Gap Between Practice and Theory (BGBP) に再録され，令和6年5月に発表を行う予定である．

報告書

(3件)

研究成果
(4件)

すべて 2023 2022

すべて学会発表 (4件) (うち国際学会 2件)

[学会発表] End-to-end training of deep boltzmann machines by unbiased contrastive divergence with local mode initialization2023
- 著者名/発表者名
  Shohei Taniguchi
- 学会等名
  International Conference on Machine Learning
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] 不偏マルコフ連鎖モンテカルロ法を用いた深層ボルツマンマシンの一気通貫学習2023
- 著者名/発表者名
  谷口尚平
- 学会等名
  人工知能学会全国大会
- 関連する報告書
  2023 実績報告書
[学会発表] 大規模言語モデルの活用による効率的なロボット制御の学習2023
- 著者名/発表者名
  高城頌太
- 学会等名
  言語処理学会第29回年次大会
- 関連する報告書
  2022 実績報告書
[学会発表] Langevin Autoencoders for Learning Deep Latent Variable Models2022
- 著者名/発表者名
  Shohei Taniguchi
- 学会等名
  Thirty-sixth Conference on Neural Information Processing Systems
- 関連する報告書
  2022 実績報告書
- 国際学会

深層ニューラルネットワークを用いた高精度で効率的な確率推論法の開発と応用

研究代表者

谷口 尚平 東京大学, 工学系研究科, 特別研究員(DC1)

2,200千円 (直接経費: 2,200千円)

報告書

研究成果

[学会発表] End-to-end training of deep boltzmann machines by unbiased contrastive divergence with local mode initialization2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] 不偏マルコフ連鎖モンテカルロ法を用いた深層ボ ルツマンマシンの一気通貫学習2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] 大規模言語モデルの活用による効率的なロボット制御の学習2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Langevin Autoencoders for Learning Deep Latent Variable Models2022

著者名/発表者名

学会等名

関連する報告書

谷口尚平東京大学, 工学系研究科, 特別研究員(DC1)

[学会発表] 不偏マルコフ連鎖モンテカルロ法を用いた深層ボルツマンマシンの一気通貫学習2023