研究領域 | データ記述科学の創出と諸分野への横断的展開 |
研究課題/領域番号 |
22H05106
|
研究種目 |
学術変革領域研究(A)
|
配分区分 | 補助金 |
審査区分 |
学術変革領域研究区分(Ⅱ)
|
研究機関 | 統計数理研究所 |
研究代表者 |
福水 健次 統計数理研究所, 先端データサイエンス研究系, 教授 (60311362)
|
研究分担者 |
下平 英寿 京都大学, 情報学研究科, 教授 (00290867)
河原 吉伸 大阪大学, 大学院情報科学研究科, 教授 (00514796)
横井 祥 東北大学, 情報科学研究科, 助教 (60888949)
|
研究期間 (年度) |
2022-06-16 – 2027-03-31
|
研究課題ステータス |
交付 (2024年度)
|
配分額 *注記 |
166,790千円 (直接経費: 128,300千円、間接経費: 38,490千円)
2024年度: 39,130千円 (直接経費: 30,100千円、間接経費: 9,030千円)
2023年度: 38,350千円 (直接経費: 29,500千円、間接経費: 8,850千円)
2022年度: 10,920千円 (直接経費: 8,400千円、間接経費: 2,520千円)
|
キーワード | 人工知能 / ダイナミクス / 統計科学 / 時系列解析 |
研究開始時の研究の概要 |
現在大きな期待を持たれている人工知能技術の中心は,データの性質に依らずに適用できる深層ニューラルネットモデルを大規模化,複雑化することにあるが,様々な課題に人工知能技術を適用していくためには,データ固有の性質のより本質的な記述と汎用的・効率的な人工知能技術とを融合することが重要である.本研究では,データの生成過程と関連性に関する幾何的な記述と推論,データの位相的情報を抽出する記述言語とその統計的信頼性,確率的ダイナミクスによるデータの記述と推論に関して研究を行う.
|
研究実績の概要 |
2023年度の研究実績は以下のとおりである. 〇データの生成過程と関連性の幾何的な記述: 自然言語の統計的な生成過程の研究として,単語のコーパス分布を事前分布,文脈における分布を事後分布ととらえ,さまざまな演算を指数型分布族の観点から自然に解釈できることを示した.分布外汎化をもたらすデータの生成過程に関して研究を行い,Invariant Risk Minimizationの方法が正しく動作するための条件を明らかにした. 〇データの位相的情報を抽出する記述言語: パーシステントホモロジーに関して,同一なパーシステント図を与える分布の同値類に関して研究を行い,パーシステント図では判別がつかない分布のクラスを明らかにした.また,グラフ上の非正規化分布に対する最適輸送の効率的アルゴリズムに関して研究を行った. 〇確率的なダイナミクスによるデータの記述と推論: 微分方程式を用いた生成モデルであるフローマッチングの方法に関して,条件付分布からの生成法に関して新たな理論と方法を構築した.また,状態空間モデルにおいて尤度が陽にかけない場合のパラメータ推定の方法に関して研究を行った.さらに,群の作用によって遷移する時系列データを用いて,Autoencoderタイプの深層学習によって非線形なフーリエ変換を学習によって求める方法を開発した.また,クープマン作用素を介した動力学のデータ解析に関して研究を進め,スペクトル構造などさまざまな性質を明らかにした.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
計画に沿って研究成果が得られており,それらの成果がICLR, ICML, EMNLP, ACLなど当該分野で高い評価を受ける国際会議論文として採択されていることから,計画以上に進展していると判断できる.
|
今後の研究の推進方策 |
現在行っている研究を継続して発展させるとともに,最近の研究動向を反映して,状態空間モデルを用いた大規模基盤モデルなどの理論,方法の研究や,微分方程式を用いた生成モデルの研究など,新しい分野を開拓する研究も推進していく.
|