複雑多様データに対する予測スパース統計モデリング手法の開発研究
Project/Area Number |
23K11008
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 60030:Statistical science-related
|
Research Institution | Kyushu University |
Principal Investigator |
川野 秀一 九州大学, 数理学研究院, 教授 (50611448)
|
Project Period (FY) |
2023-04-01 – 2026-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥4,810,000 (Direct Cost: ¥3,700,000、Indirect Cost: ¥1,110,000)
Fiscal Year 2025: ¥1,690,000 (Direct Cost: ¥1,300,000、Indirect Cost: ¥390,000)
Fiscal Year 2024: ¥1,690,000 (Direct Cost: ¥1,300,000、Indirect Cost: ¥390,000)
Fiscal Year 2023: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
|
Keywords | スパースモデリング / データ統合型統計モデル / マルチタスク学習 / ベイズモデリング / ロバスト推定 / 凸クラスタリング / 変数併合 / 馬蹄事前分布 / 統合解析 |
Outline of Research at the Start |
スパース推定に基づく統計モデルにより,疎構造を持つデータから有用な情報を抽出することが可能となった.スパース推定によるモデリング研究の中でも,予測を目的とした研究はその重要性からこれまでに数多く行われてきている.しかし,近年の複雑・多様なデータに対応するためには,これまでの解析技術をより深化させる必要がある.本研究では,スパース推定に基づく予測統計モデリングを発展させるとともに,開発した手法を様々な実データへ適用し,新たな知識発見を狙う.
|
Outline of Annual Research Achievements |
本研究課題ではスパース推定を援用した予測統計モデリングの開発を目的としている.初年度に当たる令和5年度では,以下の研究成果をあげることができた. 1.データ統合型統計モデルにおいて,多変量回帰モデルの枠組みの下,新たな方法論の開発に取り組んだ.モデルの定式化および計算アルゴリズムの設計を行い,モンテカルロ・シミュレーションや実データ解析により性能を評価した.研究成果は原著論文としてまとめ,プレプリントとして公開している. 2.凸クラスタリングに基づくマルチタスク学習モデルの開発に取り組んだ.推定方程式や計算アルゴリズムの導出は昨年度までに完了していたため,本年度は既存手法との比較を目的として数値実験を中心に行った.研究成果をまとめた原著論文は国際学術雑誌に採択された.また,外れ値タスクを考慮に入れたマルチタスク学習モデルの研究にも取り組み,理論的な性質の導出および数値実験を終え,現在プレプリントとしてまとめている. 3.以前より取り組んでいるガウス型のベイズ的併合型モデルにおいて,さらなる理論的・数値的検証を重ねた.既にプレプリントとしてまとめていた研究成果にこれらの成果を加えることにより,研究のブラッシュアップを図った.本研究成果の内容は国際誌に掲載された.また,二値データを扱うベイズ的併合型モデルの研究においては,数値実験を徹底的に行うことにより,既存手法との差異を明確にした.本研究内容はプレプリントとして公開している. 4.上記1から3以外にも次の研究に取り組んだ.疾患のスクリーニングと重症度予測を同時に行うために,順序ロジットモデルとスパース推定法に基づく方法を提案した.スパース主成分分析に含まれる調整パラメータの値をKnockoff法に基づき選択する方法を提案した.統計的因果推論の枠組みの下,共変量選択を球共分散とスパース推定法により行う二重頑健推定法を提案した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
凸クラスタリングを組み込んだマルチタスク学習モデル,ガウス型のベイズ的併合型モデルの研究成果が学術雑誌に掲載された.データ統合型統計モデル,外れ値タスクを考慮に入れたマルチタスク学習モデル,二値データを扱うベイズ的併合型モデルに対する研究成果をプレプリントとして公表することができた.
|
Strategy for Future Research Activity |
令和6年度以降は以下の課題に取り組む. 1.令和5年度に開発した多変量回帰型データ統合モデルの理論的性質を,数理的な観点から検証する.具体的には,計算アルゴリズムの収束性や推定量の性質について考察する.また,この手法では背後にある母集団分布に均一性の仮定を課しているが,より汎用的な統計モデルの構築のためには,不均一性の仮定が必要となる.不均一性の仮定を課したモデリング手法を開発し,理論的・数値的な観点から研究を進める. 2.マルチタスク学習において,タスク間の関係性をデータから推定する研究に着手する.研究を遂行するために必要な知識・技術は揃いつつあり,本研究をはじめる準備はできている.まずはKalofolias (2016) AISTATSの研究をたたき台とし,最適化問題ならびに推定方程式の定式化に取り組む. 3.上記1と2で開発した統計手法のRパッケージまたはPythonモジュールを一般に公開する.
|
Report
(1 results)
Research Products
(20 results)