Regular Deep Learning Models and Their Applications

Research Project

Project/Area Number	23K21699
Project/Area Number (Other)	21H03503 (2021-2023)
Research Category	Grant-in-Aid for Scientific Research (B)
Allocation Type	Multi-year Fund (2024) Single-year Grants (2021-2023)
Section	一般
Review Section	Basic Section 61030:Intelligent informatics-related
Research Institution	National Institute of Informatics
Principal Investigator	杉山麿人国立情報学研究所, 情報学プリンシプル研究系, 准教授 (10733876)
Project Period (FY)	2021-04-01 – 2025-03-31
Project Status	Granted (Fiscal Year 2024)
Budget Amount *help	¥17,160,000 (Direct Cost: ¥13,200,000、Indirect Cost: ¥3,960,000) Fiscal Year 2024: ¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000) Fiscal Year 2023: ¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000) Fiscal Year 2022: ¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000) Fiscal Year 2021: ¥4,680,000 (Direct Cost: ¥3,600,000、Indirect Cost: ¥1,080,000)
Keywords	機械学習 / 深層学習 / 正則モデル / 隣接代数 / 情報幾何学 / 統計モデル / テンソル分解 / テンソルネットワーク / 量子化学 / テンソル低ランク近似 / ブラインド信号源分離
Outline of Research at the Start	本研究では、正則な統計モデルによる深層構造の実現を目指す。深層学習が成功を収めているが、既存のアプローチは特異な統計モデル（パラメータに関するフィッシャー情報量行列が特異行列になるモデル）に基づくことが知られている。しかし、特異なモデルでは、モデルの理論解析や最適化が難しいため、様々な深層モデルや学習アルゴリズムが乱立しており、統一的な品質保証や性能分析が困難である。そこで本研究では、パラメータ空間の座標系に直接深層構造を実装する、というアイデアで、特異ではない正則モデルで深層構造を実現する。これによって、特異モデルに起因する様々な問題を一気に解決する。
Outline of Annual Research Achievements	本研究では、正則な統計モデルによる深層構造の実現を目指す。深層学習が成功を収めているが、既存のアプローチは特異な統計モデル（パラメータに関するフィッシャー情報量行列が特異行列になるモデル）に基づくことが知られている。しかし、特異なモデルでは、モデルの理論解析や最適化が難しいため、様々な深層モデルや学習アルゴリズムが乱立しており、統一的な品質保証や性能分析が困難という問題がある。そこで本研究では、パラメータ空間の座標系に直接深層構造を実装する、というアイデアで、特異ではない正則モデルで深層構造を実現する。これによって、特異モデルに起因する様々な問題を一気に解決する。 2023年度は、昨年度から引き続き(1)正則な統計モデルの理論的性質の解析、(2)実践的な機械学習手法の構築、そして(3)実問題における評価に取り組み、それぞれの項目で研究成果を挙げることに成功した。特筆すべき成果として、情報幾何学を用いた行列・テンソル分解の手法の理論的解析および実践的アルゴリズムの構築を進め、テンソル分解を正則な統計モデル上の学習として捉えた新規手法として「テンソル多体近似」と呼ばれる手法を確立した。この手法では、テンソルの各軸方向（モード）間の関連を陽にモデリングすることで、テンソルを低次のテンソル（ベクトルや行列）の積へと分解するとともに、統計モデルの正則性から凸最適化が保証されている。実践的な機械学習手法となっており、かつ既存の主要アプローチの一つであるテンソルネットワークとの関係も理論的に解析することに成功しており、今後の拡張性も高い。さらに手法の解釈性も高く、道路の交通データをはじめとした実世界での様々なデータにおいて、それぞれのドメインにおける背景知識を利用した多体近似によるモデリングを実施し、精度高くテンソル近似が実現できることを実験的に検証した。
Current Status of Research Progress	Current Status of Research Progress 1: Research has progressed more than it was originally planned. Reason 本研究では、モデルそのものに深層構造を組み込むのではなく、モデルが持つパラメータ空間上で深層構造を構成する、というアプローチによって、深層構造を持つ正則な統計モデルの存在を理論的に示すとともに、モデルの構成法を確立し、その構成法にしたがって実践的な機械学習手法を構築することを目的として研究を進めている。より具体的には、研究全体を通して、以下の3点を明らかにする:(1) 統計学や情報幾何学、情報理論を用いることで、深層構造を備えた正則な統計モデルの理論的性質を明らかにする。(2) 深層構造を備えた正則な統計モデルに基づく実践的な機械学習手法を構築し、標準的な機械学習タスクにおいて性能を検証することで有用性を明らかにする。(3) 量子化学や計算化学、生命科学といった実問題に適用することで、応用問題における有用性を明らかにする。これまでに、情報幾何学を用いた行列・テンソル分解手法であるテンソル多体近似と呼ばれる手法を確立した。研究項目(1)として、この理論解析を進め、テンソル分解を正則な統計モデル上の学習として捉えることで学習を凸最適化として定式化し、初期値に関わらず必ず大域的な最適解が求まることを示すとともに、関連したモデルであるテンソルネットワークとの関係を理論的に示すことに成功した。さらに、研究項目(2)として、効率的なアルゴリズムを構築し、実験においてその有効性を確認した。さらに、実世界のデータにおける有効性の検証も実施済みであり、研究項目(3)についても達成されたと考えられる。この成果は、機械学習分野のトップ国際会議 Neural Information Processing Systems (NeurIPS) で発表した。
Strategy for Future Research Activity	これまでテンソルを主な対象として研究を進めてきたが、より一般の分類問題などを対象とした学習モデルについての理論解析、および実践的手法の開発を進める。分類モデルにおいても、独立に高次相関に着目したモデリングの研究が進んでおり、また関連したアプローチとして分散を低次の分散の和へと分解する手法も知られている。そこで、本研究で開発を進めてきたアプローチとこれらの既存手法との関係を理論・実践の両面から解析することで、提案アプローチの位置付けを明確化する。また、パラメータ空間を移動した時のモデルの振る舞いの解析を同時に進める。特異モデルによる非凸最適化では局所解が大量に存在するが、うまく関数の不変性を用いてパラメータを変換することで、異なる初期値から学習した2つのモデルの間のパラメータの線形補完が可能となるLinear Mode Connectivity (LMC)と呼ばれる現象が知られている。この現象を積極的に用いることで、モデルマージと呼ばれる複数モデルのパラメータ上での統合による性能向上を実現することが可能となる。そこで、情報幾何学を用いることで、LMCやモデルマージと提案アプローチの関係を探る。様々なドメインでの実データで性能を検証することで、応用問題における有用性を明らかにする。

Report

(3 results)

Research Products
(38 results)

All 2024 2023 2022 2021 Other

All Int'l Joint Research (5 results) Journal Article (15 results) (of which Int'l Joint Research: 2 results, Peer Reviewed: 15 results, Open Access: 13 results) Presentation (18 results) (of which Int'l Joint Research: 6 results, Invited: 1 results)

[Int'l Joint Research] The University of Sydney(オーストラリア)
- Related Report
  2023 Annual Research Report
[Int'l Joint Research] The University of Sydney/University of New South Wales(オーストラリア)
- Related Report
  2022 Annual Research Report
[Int'l Joint Research] ETH Zurich(スイス)
- Related Report
  2022 Annual Research Report
[Int'l Joint Research] The University of Sydney(オーストラリア)
- Related Report
  2021 Annual Research Report
[Int'l Joint Research] ETH Zurich(スイス)
- Related Report
  2021 Annual Research Report
[Journal Article] How graph features from message passing affect graph classification and regression?2024
- Author(s)
  Yamada Masatsugu、Sugiyama Mahito
- Journal Title
  
  Intelligent Data Analysis
  
  Volume: 28 Issue: 1 Pages: 57-75
- DOI
  10.3233/ida-227190
- Related Report
  2023 Annual Research Report
- Peer Reviewed / Open Access
[Journal Article] Unsupervised Tensor Based Feature Extraction From Multivariate Time Series2023
- Author(s)
  Matsue Kiyotaka、Sugiyama Mahito
- Journal Title
  
  IEEE Access
  
  Volume: 11 Pages: 116277-116295
- DOI
  10.1109/access.2023.3326073
- Related Report
  2023 Annual Research Report
- Peer Reviewed / Open Access
[Journal Article] Molecular Graph Generation by Decomposition and Reassembling2023
- Author(s)
  Yamada Masatsugu、Sugiyama Mahito
- Journal Title
  
  ACS Omega
  
  Volume: 8 Issue: 22 Pages: 19575-19586
- DOI
  10.1021/acsomega.3c01078
- Related Report
  2023 Annual Research Report
- Peer Reviewed / Open Access
[Journal Article] Many-body Approximation for Non-negative Tensors2023
- Author(s)
  Kazu Ghalamkari、Mahito Sugiyama、Yoshinobu Kawahara
- Journal Title
  
  Advances in Neural Information Processing Systems (NeurIPS 2023)
  
  Volume: 36 Pages: 1-26
- Related Report
  2023 Annual Research Report
- Peer Reviewed / Open Access
[Journal Article] Non-negative low-rank approximations for multi-dimensional arrays on statistical manifold2023
- Author(s)
  Ghalamkari Kazu, Sugiyama Mahito
- Journal Title
  
  Information Geometry
  
  Volume: - Issue: 1 Pages: 257-292
- DOI
  10.1007/s41884-023-00100-5
- Related Report
  2022 Annual Research Report
- Peer Reviewed / Open Access
[Journal Article] Artificial neural network encoding of molecular wavefunctions for quantum computing2023
- Author(s)
  Hagai Masaya、Sugiyama Mahito、Tsuda Koji、Yanai Takeshi
- Journal Title
  
  Digital Discovery
  
  Volume: - Issue: 3 Pages: 634-650
- DOI
  10.1039/d2dd00093h
- Related Report
  2022 Annual Research Report
- Peer Reviewed / Open Access
[Journal Article] Analyzing Tree Architectures in Ensembles via Neural Tangent Kernel2023
- Author(s)
  Kanoh, R.、Sugiyama, M.
- Journal Title
  
  The 11th International Conference on Learning Representations (ICLR 2023)
  
  Volume: －
- Related Report
  2022 Annual Research Report
- Peer Reviewed / Open Access
[Journal Article] A drive-by bridge inspection framework using non-parametric clusters over projected data manifolds2022
- Author(s)
  Cheema P.、Alamdari M. Makki、Chang K.C.、Kim C.W.、Sugiyama M.
- Journal Title
  
  Mechanical Systems and Signal Processing
  
  Volume: 180 Pages: 109401-109401
- DOI
  10.1016/j.ymssp.2022.109401
- Related Report
  2022 Annual Research Report
- Peer Reviewed / Int'l Joint Research
[Journal Article] Unsupervised feature extraction from multivariate time series for outlier detection2022
- Author(s)
  Matsue Kiyotaka、Sugiyama Mahito
- Journal Title
  
  Intelligent Data Analysis
  
  Volume: 26 Issue: 6 Pages: 1451-1467
- DOI
  10.3233/ida-216128
- Related Report
  2021 Annual Research Report
- Peer Reviewed / Open Access
[Journal Article] Fast Rank-1 NMF for Missing Data with KL Divergence2022
- Author(s)
  Ghalamkari, K.、Sugiyama, M.
- Journal Title
  
  Proceedings of the 25th International Conference on Artificial Intelligence and Statistics (AISTATS 2021))
  
  Volume: 151 Pages: 2927-2940
- Related Report
  2021 Annual Research Report
- Peer Reviewed / Open Access
[Journal Article] A Neural Tangent Kernel Perspective of Infinite Tree Ensembles2022
- Author(s)
  Kanoh, R.、Sugiyama, M.
- Journal Title
  
  Proceedings of the 10th International Conference on Learning Representations (ICLR 2022)
  
  Volume: －
- Related Report
  2021 Annual Research Report
- Peer Reviewed / Open Access
[Journal Article] Hierarchical Probabilistic Model for Blind Source Separation via Legendre Transformation2021
- Author(s)
  Luo, S.、Azizi, L.、Sugiyama, M.
- Journal Title
  
  Proceedings of the 37th Conference on Uncertainty in Artificial Intelligence (UAI 2021)
  
  Volume: 161 Pages: 312-321
- Related Report
  2021 Annual Research Report
- Peer Reviewed / Open Access / Int'l Joint Research
[Journal Article] Unsupervised Tensor based Feature Extraction and Outlier Detection for Multivariate Time Series2021
- Author(s)
  Matsue Kiyotaka、Sugiyama Mahito
- Journal Title
  
  Proceedings of the 8th IEEE International Conference on Data Science and Advanced Analytics (DSAA 2021)
  
  Volume: － Pages: 1-12
- DOI
  10.1109/dsaa53316.2021.9564117
- Related Report
  2021 Annual Research Report
- Peer Reviewed
[Journal Article] Investigating Overparameterization for Non-Negative Matrix Factorization in Collaborative Filtering2021
- Author(s)
  Kawakami Yuhi、Sugiyama Mahito
- Journal Title
  
  Proceedings of the 15th ACM Conference on Recommender Systems (RecSys 2021), Late-Breaking Results Track
  
  Volume: － Pages: 685-690
- DOI
  10.1145/3460231.3478854
- Related Report
  2021 Annual Research Report
- Peer Reviewed / Open Access
[Journal Article] Fast Tucker Rank Reduction for Non-Negative Tensors Using Mean-Field Approximation2021
- Author(s)
  Ghalamkari, K.、Sugiyama, M.
- Journal Title
  
  Advances in Neural Information Processing Systems (NeurIPS 2021)
  
  Volume: 34 Pages: 443-454
- Related Report
  2021 Annual Research Report
- Peer Reviewed / Open Access
[Presentation] Energy-Based Non-Negative Tensor Factorization via Multi-Body Modeling2023
- Author(s)
  Kazu Ghalamkari、Mahito Sugiyama
- Organizer
  ICML 2023 Workshop Duality Principles for Modern Machine Learning
- Related Report
  2023 Annual Research Report
- Int'l Joint Research
[Presentation] Investigating Axis-Aligned Differentiable Trees through Neural Tangent Kernels2023
- Author(s)
  Ryuichi Kanoh、Mahito Sugiyama
- Organizer
  ICML 2023 Workshop Differentiable Almost Everything
- Related Report
  2023 Annual Research Report
- Int'l Joint Research
[Presentation] 非負テンソルの多体モデリング2023
- Author(s)
  ガラムカリ和、杉山麿人
- Organizer
  第37回人工知能学会全国大会
- Related Report
  2023 Annual Research Report
[Presentation] 任意の二分木構造に対するTree Neural Tangent Kernel2023
- Author(s)
  加納龍一、杉山麿人
- Organizer
  第37回人工知能学会全国大会
- Related Report
  2023 Annual Research Report
[Presentation] グラフの識別や回帰におけるメッセージパッシングが与える影響の解析2023
- Author(s)
  山田正嗣、杉山麿人
- Organizer
  人工知能学会第125回人工知能基本問題研究会
- Related Report
  2023 Annual Research Report
[Presentation] 機械学習におけるパラメータ空間の再考2023
- Author(s)
  杉山麿人
- Organizer
  創発的研究支援事業融合の場2023 深層学習がもたらすブレイクスルーと可能性
- Related Report
  2023 Annual Research Report
- Invited
[Presentation] Are abstract syntax trees natural? On the statistical predictability of source-code ASTs2023
- Author(s)
  パツァキ・プロフィアペトル、杉山麿人
- Organizer
  第26回情報論的学習理論ワークショップ (IBIS2023)
- Related Report
  2023 Annual Research Report
[Presentation] Non-negative low-rank approximations for multi-dimensional arrays on statistical manifold2022
- Author(s)
  Kazu Ghalamkari、Mahito Sugiyama
- Organizer
  International Conference on Information Geometry for Data Science (IG4DS)
- Related Report
  2022 Annual Research Report
- Int'l Joint Research
[Presentation] パーセプトロン学習におけるセル移植2022
- Author(s)
  石﨑龍之介、杉山麿人
- Organizer
  第25回情報論的学習理論ワークショップ（IBIS2022）
- Related Report
  2022 Annual Research Report
- Int'l Joint Research
[Presentation] テンソルの部分二体相互作用近似2022
- Author(s)
  ガラムカリ和、杉山麿人
- Organizer
  第25回情報論的学習理論ワークショップ（IBIS2022）
- Related Report
  2022 Annual Research Report
- Int'l Joint Research
[Presentation] 任意の二分木構造に対するTree Neural Tangent Kernel2022
- Author(s)
  加納龍一、杉山麿人
- Organizer
  第25回情報論的学習理論ワークショップ（IBIS2022）
- Related Report
  2022 Annual Research Report
- Int'l Joint Research
[Presentation] 平均場近似に基づく正テンソルの最良ランク１近似2021
- Author(s)
  ガラムカリ和、杉山麿人
- Organizer
  第35回人工知能学会全国大会
- Related Report
  2021 Annual Research Report
[Presentation] グラフマイニングとモンテカルロ木探索を用いた分子グラフ生成2021
- Author(s)
  山田正嗣、杉山麿人
- Organizer
  人工知能学会第117回人工知能基本問題研究会
- Related Report
  2021 Annual Research Report
[Presentation] Neural Tangent Kernelを用いたSoft Tree Ensembleの解析2021
- Author(s)
  加納龍一、杉山麿人
- Organizer
  第24回情報論的学習理論ワークショップ（IBIS2021）
- Related Report
  2021 Annual Research Report
[Presentation] 協調フィルタリングにおける非負行列因子分解の過剰パラメータ化に関する研究2021
- Author(s)
  川上雄飛、杉山麿人
- Organizer
  第24回情報論的学習理論ワークショップ（IBIS2021）
- Related Report
  2021 Annual Research Report
[Presentation] 対数線形モデルの期待値保存則に基づく高速な低タッカーランク近似2021
- Author(s)
  ガラムカリ和、杉山麿人
- Organizer
  第24回情報論的学習理論ワークショップ（IBIS2021）
- Related Report
  2021 Annual Research Report
[Presentation] 複合行列の最良ランク１近似に基づく欠損を含むランク１NMFの高速な解法2021
- Author(s)
  ガラムカリ和、杉山麿人
- Organizer
  人工知能学会第119回人工知能基本問題研究会
- Related Report
  2021 Annual Research Report
[Presentation] Neural Tangent Kernelを用いたSoft Tree Ensembleの解析2021
- Author(s)
  加納龍一、杉山麿人
- Organizer
  人工知能学会第119回人工知能基本問題研究会
- Related Report
  2021 Annual Research Report

Regular Deep Learning Models and Their Applications

Principal Investigator

杉山 麿人 国立情報学研究所, 情報学プリンシプル研究系, 准教授 (10733876)

¥17,160,000 (Direct Cost: ¥13,200,000、Indirect Cost: ¥3,960,000)

Current Status of Research Progress

Reason

Report

Research Products

[Int'l Joint Research] The University of Sydney(オーストラリア)

Related Report

[Int'l Joint Research] The University of Sydney/University of New South Wales(オーストラリア)

Related Report

[Int'l Joint Research] ETH Zurich(スイス)

Related Report

[Int'l Joint Research] The University of Sydney(オーストラリア)

Related Report

[Int'l Joint Research] ETH Zurich(スイス)

Related Report

[Journal Article] How graph features from message passing affect graph classification and regression?2024

Author(s)

Journal Title

DOI

Related Report

[Journal Article] Unsupervised Tensor Based Feature Extraction From Multivariate Time Series2023

Author(s)

Journal Title

DOI

Related Report

[Journal Article] Molecular Graph Generation by Decomposition and Reassembling2023

Author(s)

Journal Title

DOI

Related Report

[Journal Article] Many-body Approximation for Non-negative Tensors2023

Author(s)

Journal Title

Related Report

[Journal Article] Non-negative low-rank approximations for multi-dimensional arrays on statistical manifold2023

Author(s)

Journal Title

DOI

Related Report

[Journal Article] Artificial neural network encoding of molecular wavefunctions for quantum computing2023

Author(s)

Journal Title

DOI

Related Report

[Journal Article] Analyzing Tree Architectures in Ensembles via Neural Tangent Kernel2023

Author(s)

Journal Title

Related Report

[Journal Article] A drive-by bridge inspection framework using non-parametric clusters over projected data manifolds2022

Author(s)

Journal Title

DOI

Related Report

[Journal Article] Unsupervised feature extraction from multivariate time series for outlier detection2022

Author(s)

Journal Title

DOI

Related Report

[Journal Article] Fast Rank-1 NMF for Missing Data with KL Divergence2022

Author(s)

Journal Title

Related Report

[Journal Article] A Neural Tangent Kernel Perspective of Infinite Tree Ensembles2022

Author(s)

Journal Title

Related Report

[Journal Article] Hierarchical Probabilistic Model for Blind Source Separation via Legendre Transformation2021

Author(s)

Journal Title

Related Report

[Journal Article] Unsupervised Tensor based Feature Extraction and Outlier Detection for Multivariate Time Series2021

Author(s)

Journal Title

DOI

Related Report

[Journal Article] Investigating Overparameterization for Non-Negative Matrix Factorization in Collaborative Filtering2021

Author(s)

杉山麿人国立情報学研究所, 情報学プリンシプル研究系, 准教授 (10733876)