研究課題/領域番号 |
21K11783
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分60030:統計科学関連
|
研究機関 | 滋賀大学 |
研究代表者 |
杉本 知之 滋賀大学, データサイエンス学系, 教授 (70324829)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
4,030千円 (直接経費: 3,100千円、間接経費: 930千円)
2023年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2022年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2021年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
|
キーワード | 数理統計学 / 医学統計学 / 層別解析 / 確率過程 / 統計的推測 / 多変量解析 / 生存時間データ / 不完全データ / 機械学習 |
研究開始時の研究の概要 |
本研究では,不完全情報を伴うときの多次元の事象時間データの推測の理論,方法論,その機械学習法の展開を如何にすればより有意義に構築できるかを明らかにしていく.事象時間データの多次元推測では,点過程のマルチンゲール接近法を,時間方向だけでなく,イベントの種類といった多次元方向にも展開する必要があるため,先行研究の結果(Sugimoto et al, 2020)を利用して発展させていく。多次元化のモデリングには,いくつかの不完全情報を含むことも必須であり,これらのことを考慮して,より有意義な多次元推測と機械学習を組み込む展開を研究する.
|
研究実績の概要 |
本年度は,前年度から行ってきている研究内容をさらに発展させた.具体的には,(1)ランダム効果メタアナリシスのDerSimonian-Laird法に対する正確な推測理論を2値データ・メタアナリシスに展開すること,(2)時間共変量Cox回帰モデルに対する時間変化共変量に対する欠測対応としてガウス過程回帰と多重代入法を用いる方法論を実データ解析に応用すること,(3)経時測定データに対する決定木など機械学習の方法論を精緻化して構築すること,(4)2変量生存時間モデル,群逐次デザインの研究を行い,セミ競合リスクのもとで,どのようにログランク統計量が2変量分布をもつかの結果に基づいて,情報寄与あり中途打ち切りを加味した調整の研究などを行った.(1)の研究では,先行研究において連続データに対するDerSimonian-Laird法のAlmost正確推測理論を,2値データの対数オッズに置き換えたものを考えたが,試験内分散と試験間分散の間に構造的に相関を持つという問題により,連続データに対するAlmost正確推測理論の直截な適用は限界があった.それでも,既存手法よりは,ある程度統計的性能が改善することを得て,シミュレート研究を行い,論文化を行った.(2)の研究も前年度までの進行に加え,研究協力者から実データを入手して論文化を進める準備を行った.(3)の研究では決定木の構成に用いる分岐候補を選ぶ検定統計量として共変量方向と共変量と時間の交互作用方向があり,それらの理論分布の性質を調べ,決定木の構成における第1種の過誤確率を検討している.これらの研究について,いくつかの学会発表や論文発表などを行った.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究の2年次に掲げていた基礎理論の開発,方法論開発,応用の各項目について,研究計画に概ね従う形で順調に進んでいるため
|
今後の研究の推進方策 |
本研究課題の今後の推進方策は次のように考えている:(1)の研究では,ランダム効果メタアナリシスの正確な推測理論を2値データ・メタアナリシスに展開する際に得た知見を基に生存時間データに展開していくことである.(2)の研究では,時間共変量Cox回帰モデルの適用では実データ解析を入念に行い,既存手法では得るのが難しかった新たな視野を得ることを考えている.(3)の研究では,経時測定データに対する機械学習の方法論の構築では様々な分岐に対する検定統計量の相関構造を調べること,そして,超高次元多変量正規で近似することで,様々な分岐に対する多重性を考慮した形を作ることである.(4)2変量生存時間モデルのセミ競合リスクのもとでの情報寄与あり中途打ち切りを加味した調整の研究では,コピュラモデル誤特定問題を考慮することで仮定に対するロバスト性を加味していくことでより生産性のある実データ解析に展開できるものと考えている.
|