• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2021 年度 実績報告書

正則な深層学習モデルの構築とその応用

研究課題

研究課題/領域番号 21H03503
配分区分補助金
研究機関国立情報学研究所

研究代表者

杉山 麿人  国立情報学研究所, 情報学プリンシプル研究系, 准教授 (10733876)

研究期間 (年度) 2021-04-01 – 2025-03-31
キーワード機械学習 / 情報幾何学 / 正則モデル / 統計モデル / テンソル低ランク近似 / ブラインド信号源分離
研究実績の概要

本研究では、正則な統計モデルによる深層構造の実現を目指す。深層学習が成功を収めているが、既存のアプローチは特異な統計モデル(パラメータに関するフィッシャー情報量行列が特異行列になるモデル)に基づくことが知られている。しかし、特異なモデルでは、モデルの理論解析や最適化が難しいため、様々な深層モデルや学習アルゴリズムが乱立しており、統一的な品質保証や性能分析が困難という問題がある。そこで本研究では、パラメータ空間の座標系に直接深層構造を実装する、というアイデアで、特異ではない正則モデルで深層構造を実現する。これによって、特異モデルに起因する様々な問題を一気に解決する。
初年度である2021年度は、まず(1)正則な統計モデルの理論的性質の解析及び(2)実践的な機械学習手法の構築、に取り組み、それぞれの項目で研究成果を挙げることに成功した。研究項目(1)において、情報幾何学を用いた離散構造をもつ統計モデルの理論解析を進め、過剰パラメータ化を幾何的な観点から説明することを試みるとともに、研究項目(2)において、行列・テンソル分解の手法の理論的解析および実践的アルゴリズムの構築を進めた。特に、テンソル分解を正則な統計モデル上の学習として捉えることで、タッカーランクを削減するための理論的な性質を解明し、高速に低ランク近似を実施する実践的なアルゴリズムを構築することに成功した。さらに、同様の枠組みを用いて、ブラインド信号現分離を実現する新規手法を開発し、その性能を検証した。

現在までの達成度 (区分)
現在までの達成度 (区分)

1: 当初の計画以上に進展している

理由

本研究では、モデルそのものに深層構造を組み込むのではなく、モデルが持つパラメータ空間上で深層構造を構成する、というアプローチによって、深層構造を持つ正則な統計モデルの存在を理論的に示すとともに、モデルの構成法を確立し、その構成法にしたがって実践的な機械学習手法を構築することを目的として研究を進めている。より具体的には、研究全体を通して、以下の3点を明らかにする:(1) 深層構造を備えた正則な統計モデルの理論的性質を明らかにする。(2) 深層構造を備えた正則な統計モデルに基づく実践的な機械学習手法を構築し、標準的な機械学習タスクにおいて性能を検証することで有用性を明らかにする。(3) 実問題に適用することで、応用問題における性能を評価し、提案モデルの有用性を明らかにする。
まず研究項目(1)及び(2)に同時に取り組み、理論解析及び実践的手法の構築を進めた。特に、提案の正則モデルをブラインド信号源分離問題に適用し、新規アルゴリズムを構築することで、提案アプローチが持つ実効性を検証し、行列分解に基づく既存手法と比較して安定かつ高精度な分解ができることを示した。この研究成果は、統計的機械学習の分野におけるトップ国際会議の一つであるUAI2021で発表した。さらに、行列やテンソルに着目することで、深層構造を備えた正則な統計モデルの学習と、行列やテンソルを対象とした解析手法との類似性を見出し、情報幾何学を用いた手法の理論解析および新規アルゴリズム構築を進め、安定かつ高速なタッカー低ランク近似アルゴリズムを構築した。この研究成果は、機械学習分野のトップ国際会議NeurIPS2021およびAISTATS2022で発表した。

今後の研究の推進方策

まず研究項目(1)において、より詳細に提案の正則モデル上の学習と、テンソル分解をはじめとした既存モデルとの関連性を理論的に解析する。これによって、提案アプローチの立ち位置をより明確にする。研究項目(2)においては、これまでに構築した行列・テンソル分解の手法をさらに発展、一般化することで、テンソル分解を正則な統計モデル上の学習として捉えた新規手法の構築と、既存の線形代数的な操作との対応についての解析を進める。これまでランクに着目して研究が進んできた行列・テンソル分解やそれに伴う低ランク近似に対して、新たなアプローチを導入する試みであり、本研究全体の核をなす研究となることが期待される。さらに、研究項目(3)については、本研究で提案している正則モデルを用いた分子の電子波動関数を求める手法やその量子アルゴリズム開発を実施し、量子化学シミュレーションによる実証をおこなう。これは共同研究で実施する。

  • 研究成果

    (16件)

すべて 2022 2021 その他

すべて 国際共同研究 (2件) 雑誌論文 (7件) (うち国際共著 1件、 査読あり 7件、 オープンアクセス 6件) 学会発表 (7件)

  • [国際共同研究] The University of Sydney(オーストラリア)

    • 国名
      オーストラリア
    • 外国機関名
      The University of Sydney
  • [国際共同研究] ETH Zurich(スイス)

    • 国名
      スイス
    • 外国機関名
      ETH Zurich
  • [雑誌論文] Unsupervised feature extraction from multivariate time series for outlier detection2022

    • 著者名/発表者名
      Matsue Kiyotaka、Sugiyama Mahito
    • 雑誌名

      Intelligent Data Analysis

      巻: 26 ページ: 1451~1467

    • DOI

      10.3233/IDA-216128

    • 査読あり / オープンアクセス
  • [雑誌論文] Fast Rank-1 NMF for Missing Data with KL Divergence2022

    • 著者名/発表者名
      Ghalamkari, K.、Sugiyama, M.
    • 雑誌名

      Proceedings of the 25th International Conference on Artificial Intelligence and Statistics (AISTATS 2021))

      巻: 151 ページ: 2927~2940

    • 査読あり / オープンアクセス
  • [雑誌論文] A Neural Tangent Kernel Perspective of Infinite Tree Ensembles2022

    • 著者名/発表者名
      Kanoh, R.、Sugiyama, M.
    • 雑誌名

      Proceedings of the 10th International Conference on Learning Representations (ICLR 2022)

      巻: - ページ: -

    • 査読あり / オープンアクセス
  • [雑誌論文] Hierarchical Probabilistic Model for Blind Source Separation via Legendre Transformation2021

    • 著者名/発表者名
      Luo, S.、Azizi, L.、Sugiyama, M.
    • 雑誌名

      Proceedings of the 37th Conference on Uncertainty in Artificial Intelligence (UAI 2021)

      巻: 161 ページ: 312~321

    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Unsupervised Tensor based Feature Extraction and Outlier Detection for Multivariate Time Series2021

    • 著者名/発表者名
      Matsue Kiyotaka、Sugiyama Mahito
    • 雑誌名

      Proceedings of the 8th IEEE International Conference on Data Science and Advanced Analytics (DSAA 2021)

      巻: - ページ: 1~12

    • DOI

      10.1109/DSAA53316.2021.9564117

    • 査読あり
  • [雑誌論文] Investigating Overparameterization for Non-Negative Matrix Factorization in Collaborative Filtering2021

    • 著者名/発表者名
      Kawakami Yuhi、Sugiyama Mahito
    • 雑誌名

      Proceedings of the 15th ACM Conference on Recommender Systems (RecSys 2021), Late-Breaking Results Track

      巻: - ページ: 685~690

    • DOI

      10.1145/3460231.3478854

    • 査読あり / オープンアクセス
  • [雑誌論文] Fast Tucker Rank Reduction for Non-Negative Tensors Using Mean-Field Approximation2021

    • 著者名/発表者名
      Ghalamkari, K.、Sugiyama, M.
    • 雑誌名

      Advances in Neural Information Processing Systems (NeurIPS 2021)

      巻: 34 ページ: 443~454

    • 査読あり / オープンアクセス
  • [学会発表] 平均場近似に基づく正テンソルの最良ランク1近似2021

    • 著者名/発表者名
      ガラムカリ和、杉山麿人
    • 学会等名
      第35回人工知能学会全国大会
  • [学会発表] グラフマイニングとモンテカルロ木探索を用いた分子グラフ生成2021

    • 著者名/発表者名
      山田正嗣、杉山麿人
    • 学会等名
      人工知能学会 第117回人工知能基本問題研究会
  • [学会発表] Neural Tangent Kernelを用いたSoft Tree Ensembleの解析2021

    • 著者名/発表者名
      加納龍一、杉山麿人
    • 学会等名
      第24回情報論的学習理論ワークショップ(IBIS2021)
  • [学会発表] 協調フィルタリングにおける非負行列因子分解の過剰パラメータ化に関する研究2021

    • 著者名/発表者名
      川上雄飛、杉山麿人
    • 学会等名
      第24回情報論的学習理論ワークショップ(IBIS2021)
  • [学会発表] 対数線形モデルの期待値保存則に基づく高速な低タッカーランク近似2021

    • 著者名/発表者名
      ガラムカリ和、杉山麿人
    • 学会等名
      第24回情報論的学習理論ワークショップ(IBIS2021)
  • [学会発表] 複合行列の最良ランク1近似に基づく欠損を含むランク1NMFの高速な解法2021

    • 著者名/発表者名
      ガラムカリ 和、杉山 麿人
    • 学会等名
      人工知能学会 第119回人工知能基本問題研究会
  • [学会発表] Neural Tangent Kernelを用いたSoft Tree Ensembleの解析2021

    • 著者名/発表者名
      加納 龍一、杉山 麿人
    • 学会等名
      人工知能学会 第119回人工知能基本問題研究会

URL: 

公開日: 2023-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi