• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2022 Fiscal Year Annual Research Report

Fronteers of Data Science by Probabilistic Description and Inference of Dynamics

Planned Research

Project AreaEstablishing data descriptive science and its cross-disciplinary applications
Project/Area Number 22H05106
Research InstitutionThe Institute of Statistical Mathematics

Principal Investigator

福水 健次  統計数理研究所, 数理・推論研究系, 教授 (60311362)

Co-Investigator(Kenkyū-buntansha) 下平 英寿  京都大学, 情報学研究科, 教授 (00290867)
河原 吉伸  大阪大学, 情報科学研究科, 教授 (00514796)
横井 祥  東北大学, 情報科学研究科, 助教 (60888949)
Project Period (FY) 2022-06-16 – 2027-03-31
Keywords人工知能 / ダイナミクス / 統計科学 / 時系列解析
Outline of Annual Research Achievements

2022年度の研究実績は以下のとおりである.
〇データの生成過程と関連性の幾何的な記述: 自然言語の統計的な生成過程の研究として,単語のコーパス分布を事前分布,文脈における分布を事後分布と考えたときの情報ゲインが単語ベクトルのノルムの2乗に相当することを,指数型分布族の観点で示した.また,自然言語処理のモデル内でのデータの幾何的な表現に関して,Transformer と呼ばれるアーキテクチャ内での単語頻度や情報量の符号化のされかた,固有表現の埋込空間での局所性,単語集合の埋込空間での表現方法,の3点に着目して研究をおこなった.さらに,マルチタスク転移学習における表現学習について検討した.加えて,VAEにおける事後分布崩壊を防ぐ理論的な方法を開発した.
〇データの位相的情報を抽出する記述言語: データに含まれる背景ノイズにロバストなパーシステント図を構成するため,Median-of-Meansと呼ばれる方法を用いた点群向けのフィルトレーションの方法を開発した.また,グラフ上の非正規化分布に対する最適輸送の効率的アルゴリズムを開発した.
〇確率的なダイナミクスによるデータの記述と推論: 群の作用に基づく系列データをAutoencoderの学習によって線形の推移則に還元する表現学習の方法を研究した.また,確率的力学系の汎用的な表現方法の一つである転送作用素の推定に関連した研究を遂行した.例えば,深層学習を用いたend-to-endの学習により,転送作用素の随伴であるクープマン作用素による非線形ダイナミクスの主要なモードを推定するモデルを提案し,十分に高次元な観測が得られない場合においても観測量の学習を通して作用素表現,及び主要モードを高精度で推定可能であることを確かめた .さらに,系列データの非線形正準相関解析による埋め込みを介した拡散生成モデルに関する検討を進めた.

Current Status of Research Progress
Current Status of Research Progress

1: Research has progressed more than it was originally planned.

Reason

研究が計画に沿って進んでいることに加えて,ICML, AISTATSなど機械学習分野のトップ国際会議などへの採択などを含む高い成果が具体的にあらわれているため,計画以上進展していると判断できる.

Strategy for Future Research Activity

R4年度の知見に基づいて,今年度は以下述べるように3つの研究課題を進めていく.引き続き,研究に関する方向性を各参加メンバーが共有することを目的として,オンラインを併用しながら高い頻度で議論をする機会を設ける.また博士研究員の雇用などにより研究体制を強化する.
〇データの幾何的記述と推論: 自然言語などの巨大な系列やグラフデータのベクトル的な埋め込みに関して,データに内在する加法性などの演算原理に関する研究を発展させる.また,カーネル法によるベイズ推論に関して,尤度無し推論と時系列に応用可能な方法について検討を行う.さらに,基礎研究班と連携のもと最適輸送と拡散モデルを用いた推論法に関して研究を行う.
〇位相的データ記述言語の統計的性質: 従来のTDAが不得手としていた背景ノイズに対してロバスト性を持つ方法を継続して研究する.特に点群からのパーシステント図のロバストな構成法に関して実験的,理論的に研究を行い,天文データへのロバストTDAの適用をはかるとともに,材料科学班と連携して材料TDAへの有効な応用課題を検討する.
〇確率的なダイナミクスによるデータの推論と記述: Koopman作用素と深層学習を用いてデータから未知のダイナミクスを学習し,将来の予測や未知パラメータの推定を行う方法に関して研究を行う.特に,パラメトリックな微分方程式や確率微分方程式によるモデルが仮定できる場合に,そのモデルを融合して用いる方法に関して研究を進める.また,生命科学班や応用探索班と連携して,具体的に解決すべき問題を探索する.

  • Research Products

    (26 results)

All 2023 2022 Other

All Int'l Joint Research (3 results) Journal Article (8 results) (of which Peer Reviewed: 3 results,  Open Access: 8 results) Presentation (13 results) (of which Int'l Joint Research: 1 results,  Invited: 8 results) Patent(Industrial Property Rights) (1 results) Funded Workshop (1 results)

  • [Int'l Joint Research] Pennsylvania State University(米国)

    • Country Name
      U.S.A.
    • Counterpart Institution
      Pennsylvania State University
  • [Int'l Joint Research] University College London/Newcastle University(英国)

    • Country Name
      UNITED KINGDOM
    • Counterpart Institution
      University College London/Newcastle University
  • [Int'l Joint Research] University of Adelaide(オーストラリア)

    • Country Name
      AUSTRALIA
    • Counterpart Institution
      University of Adelaide
  • [Journal Article] Controlling Posterior Collapse by an Inverse Lipschitz Constraint on the Decoder Network2023

    • Author(s)
      Yuri Kinoshita, Kenta Oono, Kenji Fukumizu, Yuichi Yoshida, Shin-ichi Maeda
    • Journal Title

      Proceedings of the Fortieth International Conference on Machine Learning

      Volume: 1 Pages: 1-7

    • Peer Reviewed / Open Access
  • [Journal Article] Scalable Unbalanced Sobolev Transport for Measures on a Graph2023

    • Author(s)
      Le, T., Nguyen, T, Fukumizu, K.
    • Journal Title

      Proceedings of Machine Learning Research (Proceedings of The 26th International Conference on Artificial Intelligence and Statistics)

      Volume: 206 Pages: 8521-8560

    • Peer Reviewed / Open Access
  • [Journal Article] Transformer言語モデルの予測ヘッド内バイアスによる頻度補正効果2023

    • Author(s)
      小林 悟郎, 栗林 樹生, 横井 祥, 乾 健太郎
    • Journal Title

      言語処理学会 第29回年次大会 発表論文集

      Volume: 1 Pages: 645--650

    • Open Access
  • [Journal Article] BERTを用いた文埋め込みモデルの単語の暗黙的な重み付け2023

    • Author(s)
      栗田 宙人, 小林 悟郎, 横井 祥, 乾 健太郎.
    • Journal Title

      言語処理学会 第29回年次大会 発表論文集

      Volume: 1 Pages: 639--644

    • Open Access
  • [Journal Article] 事前学習済み言語モデルによるエンティティの概念化2023

    • Author(s)
      坂田 将樹, 横井 祥, Benjamin Heinzerling, 乾 健太郎.
    • Journal Title

      言語処理学会 第29回年次大会 発表論文集

      Volume: 1 Pages: 1310--1315

    • Open Access
  • [Journal Article] 柔らかいジャンプ付き編集距離に向けて2023

    • Author(s)
      亀井 遼平, 横井 祥, 仲村 祐希, 渡辺 太郎, 乾 健太郎.
    • Journal Title

      言語処理学会 第29回年次大会 発表論文集

      Volume: 1 Pages: 1192--1197

    • Open Access
  • [Journal Article] 正準角および部分空間に基づくBERTScoreの拡張2023

    • Author(s)
      石橋 陽一, 横井 祥, 須藤 克仁, 中村 哲.
    • Journal Title

      言語処理学会 第29回年次大会 発表論文集

      Volume: 1 Pages: 904--909

    • Open Access
  • [Journal Article] Estimating counterfactual treatment outcomes over time in multi-vehicle simulation2022

    • Author(s)
      Fujii Keisuke, Takeuchi Koh, Kuribayashi Atsushi, Takeishi Naoya, Kawahara Yoshinobu、Takeda Kazuya
    • Journal Title

      Proceedings of the 30th ACM SIGPATIAL International Conference on Advances in Geographic Information Systems (SIGSPATIAL'22)

      Volume: No. 7 Pages: 1-4

    • DOI

      10.1145/3557915.3560941

    • Peer Reviewed / Open Access
  • [Presentation] 群の表現を用いた時系列からの情報抽出2023

    • Author(s)
      福水健次
    • Organizer
      機械学習と複素幾何に関するワークショップ
  • [Presentation] 系列データを用いた同変性による表現学習2023

    • Author(s)
      福水健次
    • Organizer
      公開シンポジウム データ駆動科学と情報計測の新展開
    • Invited
  • [Presentation] 群の作用により生成される時系列データからの表現学習2023

    • Author(s)
      福水健次
    • Organizer
      パーシステントホモロジー と表現論
    • Invited
  • [Presentation] データ駆動による複雑ダイナミクス解析の新展開2023

    • Author(s)
      河原吉伸
    • Organizer
      公開シンポジウム データ駆動科学と情報計測の新展開
    • Invited
  • [Presentation] Isotropy of word embedding space2023

    • Author(s)
      横井祥
    • Organizer
      第4回理研AIP数学系合同セミナー
    • Invited
  • [Presentation] ChatGPT と自然言語処理2023

    • Author(s)
      横井祥
    • Organizer
      言語の意味の計算と最適輸送. Workshop OT 2023
    • Invited
  • [Presentation] Representation Learning of Equivariant Structure from Sequences2023

    • Author(s)
      Kenji Fukumizu
    • Organizer
      Workshop on Functional Inference and Machine Intelligence 2023
    • Int'l Joint Research / Invited
  • [Presentation] 位相的データ解析とその応用2022

    • Author(s)
      福水健次
    • Organizer
      天文学における データ科学的方法
    • Invited
  • [Presentation] 構造を持った言語データと最適輸送2022

    • Author(s)
      横井祥
    • Organizer
      NAIST DSC NLP Seminar 2022
    • Invited
  • [Presentation] 報酬が過去の履歴に依存する場合のバンディットアルゴリズム2022

    • Author(s)
      谷本悠斗; 福水健次
    • Organizer
      第25回情報論的学習理論ワークショップ (IBIS2022)
  • [Presentation] ラベルの階層性による不変学習2022

    • Author(s)
      豊田祥史; 福水健次
    • Organizer
      第25回情報論的学習理論ワークショップ (IBIS2022)
  • [Presentation] 単語ベクトルの長さはKL情報量で解釈可能な意味の強さを表す2022

    • Author(s)
      大山百々勢, 横井祥, 下平英寿
    • Organizer
      第25回情報論的学習理論ワークショップ (IBIS2022)
  • [Presentation] Heterogeneous-featureを用いたマルチタスク転移学習2022

    • Author(s)
      Runsen Li, 奥野彰文, 下平英寿
    • Organizer
      第25回情報論的学習理論ワークショップ (IBIS2022)
  • [Patent(Industrial Property Rights)] 制御方法、制御装置、及びプログラム2022

    • Inventor(s)
      岩田具治, 河原吉伸
    • Industrial Property Rights Holder
      日本電信電話株式会社, 国立大学法人九州大学
    • Industrial Property Rights Type
      特許
    • Patent Publication Number
      特開2023-003532
  • [Funded Workshop] Workshop on Functional Inference and Machine Intelligence 20232023

URL: 

Published: 2023-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi