2022 年度実施状況報告書

深層統計モデルによる科学的仮説検証のための非漸近推測理論の開発

研究課題

研究課題/領域番号	21K11780
研究機関	東京大学
研究代表者	今泉允聡東京大学, 大学院総合文化研究科, 准教授 (90814088)
研究期間 (年度)	2021-04-01 – 2024-03-31
キーワード	深層学習 / 統計学 / 統計的推論
研究実績の概要	本研究計画の目的は、深層ニューラルネットワークなどの多層構造や大自由度を持つ統計的モデルに対して、データに依存する不確実性を評価し、推定・予測の誤差を評価したり統計的推論の手法を構成することである。具体的には、ニューラルネットワークの関数表現能力を解析するとともに、データや学習アルゴリズムが持つランダムさ（不確実性）が推定や予測に与える影響を解析する。本年の研究実績は、主に二つに分けられる。一つは層が浅いが非常に多いパラメータを持つモデル（ニューラルネットワーク含む）に対する推定・推論性能の導出、もう一つは層が多いニューラルネットワークに対する推定性能の導出、の2点である。一つ目の層が浅いがパラメータが多いモデルについて、複数の応用的な設定において、学習によって得られるモデルの推定誤差や推論のための漸近分布をおこなった。具体的には、従属性を保つデータのための線形モデル、因果推論に用いられるモーメント制約や内生性を持つモデル、関数データなどの無限次元性を持つモデル、最適輸送を用いた統計モデルのような二重の最適化問題で定義される関数モデルについて、その推定誤差や漸近分布を導出した。これらの応用的研究は、近年発展している過剰パラメータ理論などをより幅広い統計モデルで使えることを示すものである。これらの研究はいくつかの学術雑誌に採択され、またいくつかは査読中である。二つ目の層が多いモデルについては、損失関数の形状に基づく予測誤差（汎化誤差）の特徴付けをおこなった。具体的には、非凸な期待損失関数が局所最適解の近傍で良い性質を持っているときに、学習アルゴリズムがその解の近傍に滞留しかつ良い予測性能を持つことを示した。これは、層の数やパラメータが大きいときにもそれらの影響が予測誤差に直接は影響しないことを示している。この研究は権威ある学術雑誌に採択された。
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由本研究計画は、まず層の浅いモデルで推定や推論を行うという目的については、想定以上に順調に進展していると考えられる。共同研究者や研究室の学生との連携が円滑に進行していることもあり、複数のプロジェクトで既存理論を拡張・応用する研究が進展しており、複数の学会発表や論文公開が実践できている。またそれらのプロジェクトを経ることで、研究室としても知識の蓄積や研究体制の整備を進められている。この体制は来年以降も継続できる見込みである。層の多いモデルの推定・推論については、問題が高度に非自明になるため可視化できる成果はそれほど多くないが、それでも複数の研究方針が確立され、水面化で順調に議論や証明などが進行している。詳細は次項目の「今後の研究の推進方策」に述べるが、層の多いモデルを解析するための理論を複数開発しており、こちらも順調に進展していると考えられる。
今後の研究の推進方策	今後の研究課題も、これまで同様以下の二つで進行する。一つは、層の少なくパラメータの数が非常に多いモデルのための理論の応用・拡張である。近年はこの分野の理論がさらに発展しているため、より幅広い統計モデルや推定方法について、新規性のある理論を導出することが可能である。例えばほぼ無限個のパラメータがある統計モデルのためのベイズ推定・推論や、非線形構造を内部にもつセミパラメトリックな統計モデルのための統計的推論手法の開発である。これらは研究室の学生及び共同研究者を中心に成果が出始めており、年内に論文を公開することが可能である。もう一つは、層が多いモデルのための統計的な記述と推論手法の開発である。この領域はまだ確立された基礎理論がないため、どのような方針で推論を行うかが自明でなく、一つ目と比べると困難な問題である。これに対して、いくつかのガウス近似法や推論手法が応用できる可能性が明らかになったため、今後はこれらの理論を深層モデルに応用して推論を行う方法を開発する。
次年度使用額が生じた理由	購入する物品の金額などの関係で、微細な金額が次年度仕様になった。次年度においては、旅費や物品購入などに用いる。

研究成果
(42件)

すべて 2023 2022 その他

すべて国際共同研究 (2件) 雑誌論文 (8件) (うち国際共著 3件、査読あり 8件、オープンアクセス 8件) 学会発表 (28件) (うち国際学会 10件、招待講演 12件) 図書 (2件) 備考 (2件)

[国際共同研究] Twenty University(オランダ)
- 国名
  オランダ
- 外国機関名
  Twenty University
[国際共同研究] Max Planck Institute(ドイツ)
- 国名
  ドイツ
- 外国機関名
  Max Planck Institute
[雑誌論文] Unified Perspective on Probability Divergence via the Density-Ratio Likelihood: Bridging KL-Divergence and Integral Probability Metrics2023
- 著者名/発表者名
  Masahiro Kato, Masaaki Imaizumi, Kentaro Minami
- 雑誌名
  
  Proceedings of Machine Learning Research
  
  巻: 206 ページ: 5271--5298
- 査読あり / オープンアクセス
[雑誌論文] On Generalization Bounds for Deep Networks Based on Loss Surface Implicit Regularization2023
- 著者名/発表者名
  Masaaki Imaizumi, Johannes Schmidt-Hieber
- 雑誌名
  
  IEEE Transactions on Information Theory
  
  巻: 69 ページ: 1203～1223
- DOI
  10.1109/TIT.2022.3215088
- 査読あり / オープンアクセス / 国際共著
[雑誌論文] Instrumental variable regression via kernel maximum moment loss2023
- 著者名/発表者名
  Zhang Rui、Imaizumi Masaaki、Sch?lkopf Bernhard、Muandet Krikamol
- 雑誌名
  
  Journal of Causal Inference
  
  巻: 11 ページ: none
- DOI
  10.1515/jci-2022-0073
- 査読あり / オープンアクセス / 国際共著
[雑誌論文] Fast Convergence on Perfect Classification for Functional Data2022
- 著者名/発表者名
  Tomoya Wakayama, Masaaki Imaizumi
- 雑誌名
  
  Statistica Sinica
  
  巻: to appear ページ: to appear
- 査読あり / オープンアクセス
[雑誌論文] Inference for Projection-Based Wasserstein Distances on Finite Spaces2022
- 著者名/発表者名
  Ryo Okano, Masaaki Imaizumi
- 雑誌名
  
  Statistica Sinica
  
  巻: to appear ページ: to appear
- 査読あり / オープンアクセス
[雑誌論文] Advantage of Deep Neural Networks for Estimating Functions with Singularity on Hypersurfaces2022
- 著者名/発表者名
  Masaaki Imaizumi, Kenji Fukumizu
- 雑誌名
  
  Journal of Machine Learning Research
  
  巻: 23 ページ: 1-54
- 査読あり / オープンアクセス
[雑誌論文] 超曲面上に特異性を持つ関数推定における深層ニューラルネットワークの優位性2022
- 著者名/発表者名
  今泉允聡
- 雑誌名
  
  日本統計学会誌
  
  巻: 52 ページ: 33～51
- DOI
  10.11329/jjssj.52.33
- 査読あり / オープンアクセス
[雑誌論文] Learning Causal Models from Conditional Moment Restrictions by Importance Weighting2022
- 著者名/発表者名
  Masahiro Kato, Masaaki Imaizumi, Kenichiro McAlinn, Shota Yasui, Haruo Kakehi
- 雑誌名
  
  International Conference on Learning Representations
  
  巻: to appear ページ: none
- 査読あり / オープンアクセス / 国際共著
[学会発表] 高次元ガウス近似によるWasserstein距離推定の不確実性評価2022
- 著者名/発表者名
  今泉允聡
- 学会等名
  Workshop OT 2023
- 招待講演
[学会発表] High-Dimensional Estimators: Universality and Non-Linearity2022
- 著者名/発表者名
  Masaaki Imaizumi
- 学会等名
  Workshop on Functional Inference and Machine Intelligence
- 国際学会 / 招待講演
[学会発表] フィルターが小さい深層CNNの最適近似レート2022
- 著者名/発表者名
  佐藤佑真、今泉允聡
- 学会等名
  情報論的学習理論と機械学習研究会（IBISML）
[学会発表] 深層学習と過剰パラメータの理論2022
- 著者名/発表者名
  今泉允聡
- 学会等名
  フォレストワークショップ2023
- 招待講演
[学会発表] Why does SGD prefer flat minima?: Through the lens of dynamical systems2022
- 著者名/発表者名
  Hikaru Ibayashi, Masaaki Imaizumi
- 学会等名
  AAAI When Machine Learning meets Dynamical Systems: Theory and Applications
- 国際学会
[学会発表] 深層学習と過剰パラメータの理論2022
- 著者名/発表者名
  今泉允聡
- 学会等名
  国立精神・神経医療研究センターの脳病態数理・データ科学セミナーシリーズ
- 招待講演
[学会発表] Best Arm Identification with a Fixed Budget under a Small Gap2022
- 著者名/発表者名
  M.Kato, K.Ariu, M.Imaizumi, M.Uehara, M.Nomura
- 学会等名
  2023 ASA Annual Meeting
- 国際学会
[学会発表] High-dimensional asymptotics for single-index models via approximate message passing2022
- 著者名/発表者名
  Y. Uematsu, K. Sawaya, M. Imaizumi
- 学会等名
  CMStatistics
- 国際学会 / 招待講演
[学会発表] Sup-norm convergence of deep network estimator for nonparametric regression with corrected adversarial training2022
- 著者名/発表者名
  M.Imaizumi
- 学会等名
  CMStatistics
- 国際学会 / 招待講演
[学会発表] Theory of Deep Learning and Overparmeterization2022
- 著者名/発表者名
  M.Imaizumi
- 学会等名
  Online Asian Machine Learning School, Asian Conference on Machine Learning
- 国際学会 / 招待講演
[学会発表] Hypothesis Test and Confidence Analysis with Wasserstein Distance on General Dimension2022
- 著者名/発表者名
  M.Imaizumi
- 学会等名
  EcoSta
- 国際学会 / 招待講演
[学会発表] Benign overfitting in stochastic regression2022
- 著者名/発表者名
  S.Nakakita, M.Imaizumi
- 学会等名
  EcoSta
- 国際学会 / 招待講演
[学会発表] Semiparametric Contextual Best Arm Identification with a Fixed Budget2022
- 著者名/発表者名
  加藤真大, 今泉允聡, 石原卓弥, 北川透
- 学会等名
  IBIS2022
[学会発表] Dynamics of Deep Neural Network: A Functional and Diffusion Process Approach2022
- 著者名/発表者名
  西澤渉, 今泉允聡
- 学会等名
  IBIS2022
[学会発表] 非スパースな高次元漸近論の理論と応用2022
- 著者名/発表者名
  今泉允聡
- 学会等名
  大規模複雑データの理論と方法論～新たな発展と関連分野への応用～
[学会発表] メカニズムとの学際的統合による新しい分散学習理論基盤の構築2022
- 著者名/発表者名
  今泉允聡
- 学会等名
  IPSJ連続セミナー2022「その先へ　情報技術が貢献できること」
- 招待講演
[学会発表] High-Dimensional Asymptotics of Semiparametric Generalized Linear Models via Approximate Message Passing2022
- 著者名/発表者名
  澤谷一磨、植松良公、今泉允聡
- 学会等名
  統計関連学会連合大会
[学会発表] 操作変数による非スパース高次元な線形回帰モデルの良性過適合2022
- 著者名/発表者名
  津田俊樹、今泉允聡
- 学会等名
  統計関連学会連合大会
[学会発表] 多変量ガウス分布間回帰2022
- 著者名/発表者名
  岡野遼、今泉允聡
- 学会等名
  統計関連学会連合大会
[学会発表] 補正付敵対的訓練による深層ニューラルネットワーク推定量のSupノルム収束2022
- 著者名/発表者名
  今泉允聡
- 学会等名
  統計関連学会連合大会
[学会発表] Benign-Overfitting of Overparameterized Bayesian Linear Regression2022
- 著者名/発表者名
  若山智哉、今泉允聡
- 学会等名
  統計関連学会連合大会
[学会発表] 線形時系列モデルにおける良性過適合2022
- 著者名/発表者名
  仲北祥悟、
- 学会等名
  統計関連学会連合大会
[学会発表] 深層学習の原理を明らかにする理論の試み2022
- 著者名/発表者名
  今泉允聡
- 学会等名
  電子情報通信学会Webinarチュートリアルシリーズ
- 招待講演
[学会発表] 深層学習の原理に挑む理論の試み2022
- 著者名/発表者名
  今泉允聡
- 学会等名
  第46回IBISML研究会
[学会発表] 深層学習の原理を明らかにする理論の試み2022
- 著者名/発表者名
  Masaaki Imaizumi
- 学会等名
  JFFoS
- 招待講演
[学会発表] 深層学習の原理記述に向けた構造汎化理論スキームの開発2022
- 著者名/発表者名
  今泉允聡
- 学会等名
  JST創発的研究支援事業「融合の場」第１回公開シンポジウム
[学会発表] Benign Overfitting in Overparameterized Time Series Models2022
- 著者名/発表者名
  Shogo Nakakita, Masaaki Imaizumi
- 学会等名
  Workshop on the Theory of Overparameterized Machine Learning
- 国際学会
[学会発表] Benign Overfitting in Conditional Average Treatment Effect Prediction with Linear Regression2022
- 著者名/発表者名
  Masahiro Kato, Masaaki Imaizumi
- 学会等名
  Workshop on the Theory of Overparameterized Machine Learning
- 国際学会
[図書] 応用基礎としてのデータサイエンス　AI×データ活用の実践2023
- 著者名/発表者名
  北川源四郎、竹村彰通、赤穂昭太郎、今泉允聡、内田誠一、清智也、高野渉、辻真吾、原尚幸、久野遼平、松原仁、宮地充子、森畑明昌、宿久洋
- 総ページ数
  384
- 出版者
  講談社
- ISBN
  4065307899
[図書] ニューラルネットワークとディープラーニング2022
- 著者名/発表者名
  Charu C. Aggarwal、竹村　彰通、今泉　允聡、李　鍾賛、今井　貴史、今井　徹、紅林　亘、齋藤　邦彦、健山　智子、寺田　裕、西出　俊、西出　亮
- 総ページ数
  520
- 出版者
  学術図書出版社
- ISBN
  4780607140
[備考] 深層学習の原理を説明する新理論――ニューラルネットワークのエネルギー曲面上の滞留現象
- URL
  https://www.u-tokyo.ac.jp/focus/ja/press/z0109_00065.html
[備考] 深層学習が優位性を発揮する特異データ空間の存在を証明
- URL
  https://research-er.jp/articles/view/111826

2022 年度 実施状況報告書

深層統計モデルによる科学的仮説検証のための非漸近推測理論の開発

研究代表者

今泉 允聡 東京大学, 大学院総合文化研究科, 准教授 (90814088)

現在までの達成度 (区分)

理由

研究成果

[国際共同研究] Twenty University(オランダ)

国名

外国機関名

[国際共同研究] Max Planck Institute(ドイツ)

国名

外国機関名

[雑誌論文] Unified Perspective on Probability Divergence via the Density-Ratio Likelihood: Bridging KL-Divergence and Integral Probability Metrics2023

著者名/発表者名

雑誌名

[雑誌論文] On Generalization Bounds for Deep Networks Based on Loss Surface Implicit Regularization2023

著者名/発表者名

雑誌名

DOI

[雑誌論文] Instrumental variable regression via kernel maximum moment loss2023

著者名/発表者名

雑誌名

DOI

[雑誌論文] Fast Convergence on Perfect Classification for Functional Data2022

著者名/発表者名

雑誌名

[雑誌論文] Inference for Projection-Based Wasserstein Distances on Finite Spaces2022

著者名/発表者名

雑誌名

[雑誌論文] Advantage of Deep Neural Networks for Estimating Functions with Singularity on Hypersurfaces2022

著者名/発表者名

雑誌名

[雑誌論文] 超曲面上に特異性を持つ関数推定における深層ニューラルネットワークの優位性2022

著者名/発表者名

雑誌名

DOI

[雑誌論文] Learning Causal Models from Conditional Moment Restrictions by Importance Weighting2022

著者名/発表者名

雑誌名

[学会発表] 高次元ガウス近似によるWasserstein距離推定の不確実性評価2022

著者名/発表者名

学会等名

[学会発表] High-Dimensional Estimators: Universality and Non-Linearity2022

著者名/発表者名

学会等名

[学会発表] フィルターが小さい深層CNNの最適近似レート2022

著者名/発表者名

学会等名

[学会発表] 深層学習と過剰パラメータの理論2022

著者名/発表者名

学会等名

[学会発表] Why does SGD prefer flat minima?: Through the lens of dynamical systems2022

著者名/発表者名

学会等名

[学会発表] 深層学習と過剰パラメータの理論2022

著者名/発表者名

学会等名

[学会発表] Best Arm Identification with a Fixed Budget under a Small Gap2022

著者名/発表者名

学会等名

[学会発表] High-dimensional asymptotics for single-index models via approximate message passing2022

著者名/発表者名

学会等名

[学会発表] Sup-norm convergence of deep network estimator for nonparametric regression with corrected adversarial training2022

著者名/発表者名

学会等名

[学会発表] Theory of Deep Learning and Overparmeterization2022

著者名/発表者名

学会等名

[学会発表] Hypothesis Test and Confidence Analysis with Wasserstein Distance on General Dimension2022

著者名/発表者名

学会等名

[学会発表] Benign overfitting in stochastic regression2022

著者名/発表者名

学会等名

[学会発表] Semiparametric Contextual Best Arm Identification with a Fixed Budget2022

著者名/発表者名

学会等名

[学会発表] Dynamics of Deep Neural Network: A Functional and Diffusion Process Approach2022

2022 年度実施状況報告書

今泉允聡東京大学, 大学院総合文化研究科, 准教授 (90814088)

[図書] 応用基礎としてのデータサイエンス　AI×データ活用の実践2023