不完全情報を伴う多次元の事象時間データの推測と機械学習法

研究課題

研究課題/領域番号	21K11783
研究種目	基盤研究(C)
配分区分	基金
応募区分	一般
審査区分	小区分60030:統計科学関連
研究機関	滋賀大学
研究代表者	杉本知之滋賀大学, データサイエンス学系, 教授 (70324829)
研究期間 (年度)	2021-04-01 – 2024-03-31
研究課題ステータス	交付 (2022年度)
配分額 *注記	4,030千円 (直接経費: 3,100千円、間接経費: 930千円) 2023年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円) 2022年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円) 2021年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
キーワード	数理統計学 / 医学統計学 / 層別解析 / 確率過程 / 統計的推測 / 多変量解析 / 生存時間データ / 不完全データ / 機械学習
研究開始時の研究の概要	本研究では，不完全情報を伴うときの多次元の事象時間データの推測の理論，方法論，その機械学習法の展開を如何にすればより有意義に構築できるかを明らかにしていく．事象時間データの多次元推測では，点過程のマルチンゲール接近法を，時間方向だけでなく，イベントの種類といった多次元方向にも展開する必要があるため，先行研究の結果(Sugimoto et al, 2020)を利用して発展させていく。多次元化のモデリングには，いくつかの不完全情報を含むことも必須であり，これらのことを考慮して，より有意義な多次元推測と機械学習を組み込む展開を研究する．
研究実績の概要	本年度は，前年度から行ってきている研究内容をさらに発展させた．具体的には，(1)ランダム効果メタアナリシスのDerSimonian-Laird法に対する正確な推測理論を2値データ・メタアナリシスに展開すること，(2)時間共変量Cox回帰モデルに対する時間変化共変量に対する欠測対応としてガウス過程回帰と多重代入法を用いる方法論を実データ解析に応用すること，(3)経時測定データに対する決定木など機械学習の方法論を精緻化して構築すること，(4)2変量生存時間モデル，群逐次デザインの研究を行い，セミ競合リスクのもとで，どのようにログランク統計量が2変量分布をもつかの結果に基づいて，情報寄与あり中途打ち切りを加味した調整の研究などを行った．(1)の研究では，先行研究において連続データに対するDerSimonian-Laird法のAlmost正確推測理論を，2値データの対数オッズに置き換えたものを考えたが，試験内分散と試験間分散の間に構造的に相関を持つという問題により，連続データに対するAlmost正確推測理論の直截な適用は限界があった．それでも，既存手法よりは，ある程度統計的性能が改善することを得て，シミュレート研究を行い，論文化を行った．(2)の研究も前年度までの進行に加え，研究協力者から実データを入手して論文化を進める準備を行った．(3)の研究では決定木の構成に用いる分岐候補を選ぶ検定統計量として共変量方向と共変量と時間の交互作用方向があり，それらの理論分布の性質を調べ，決定木の構成における第1種の過誤確率を検討している．これらの研究について，いくつかの学会発表や論文発表などを行った．
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由本研究の２年次に掲げていた基礎理論の開発，方法論開発，応用の各項目について，研究計画に概ね従う形で順調に進んでいるため
今後の研究の推進方策	本研究課題の今後の推進方策は次のように考えている：(1)の研究では，ランダム効果メタアナリシスの正確な推測理論を2値データ・メタアナリシスに展開する際に得た知見を基に生存時間データに展開していくことである．(2)の研究では，時間共変量Cox回帰モデルの適用では実データ解析を入念に行い，既存手法では得るのが難しかった新たな視野を得ることを考えている．(3)の研究では，経時測定データに対する機械学習の方法論の構築では様々な分岐に対する検定統計量の相関構造を調べること，そして，超高次元多変量正規で近似することで，様々な分岐に対する多重性を考慮した形を作ることである．(4)2変量生存時間モデルのセミ競合リスクのもとでの情報寄与あり中途打ち切りを加味した調整の研究では，コピュラモデル誤特定問題を考慮することで仮定に対するロバスト性を加味していくことでより生産性のある実データ解析に展開できるものと考えている．

報告書

(2件)

2022 実施状況報告書
2021 実施状況報告書

研究成果

(8件)

すべて 2023 2022 2021

すべて雑誌論文 (3件) (うち査読あり 2件) 学会発表 (4件) (うち招待講演 2件) 図書 (1件)

[雑誌論文] 2変量生存時間モデルにおけるコピュラとその利用2023
- 著者名/発表者名
  杉本知之、田中健太
- 雑誌名
  
  日本統計学会誌
  
  巻: 52 号: 2 ページ: 153-176
- DOI
  10.11329/jjssj.52.153
- ISSN
  0389-5602, 2189-1478
- 年月日
  2023-03-01
- 関連する報告書
  2022 実施状況報告書
- 査読あり
[雑誌論文] 計算代数統計を用いたログランク検定2023
- 著者名/発表者名
  水間浩太郎、杉本知之
- 雑誌名
  
  日本統計学会誌
  
  巻: 52 号: 2 ページ: 355-371
- DOI
  10.11329/jjssj.52.355
- ISSN
  0389-5602, 2189-1478
- 年月日
  2023-03-01
- 関連する報告書
  2022 実施状況報告書
[雑誌論文] Inference using an exact distribution of test statistic for random-effects meta-analysis2022
- 著者名/発表者名
  Hanada Keisuke、Sugimoto Tomoyuki
- 雑誌名
  
  Annals of the Institute of Statistical Mathematics
  
  巻: 75 号: 2 ページ: 281-302
- DOI
  10.1007/s10463-022-00844-4
- 関連する報告書
  2022 実施状況報告書
- 査読あり
[学会発表] 2変量2値データに対する群逐次同時信頼区間について2022
- 著者名/発表者名
  川崎大輔, 杉本知之
- 学会等名
  日本計算機統計学会第36回シンポジウム
- 関連する報告書
  2022 実施状況報告書
[学会発表] 多変量生存時間モデル2022
- 著者名/発表者名
  杉本知之
- 学会等名
  2022年度計量生物セミナー「生存時間解析」
- 関連する報告書
  2022 実施状況報告書
- 招待講演
[学会発表] 時間共変量を含むCox回帰モデルにおけるガウス過程回帰と多重代入法の利用について2021
- 著者名/発表者名
  田中健太，杉本知之
- 学会等名
  2021年度統計関連学会連合大会
- 関連する報告書
  2021 実施状況報告書
[学会発表] 2変量事象時間アウトカムと群逐次ログランク法について2021
- 著者名/発表者名
  杉本知之
- 学会等名
  2021年度統計関連学会連合大会
- 関連する報告書
  2021 実施状況報告書
- 招待講演
[図書] 生存時間解析2021
- 著者名/発表者名
  杉本知之
- 総ページ数
  240
- 出版者
  朝倉書店
- ISBN
  4254128614
- 関連する報告書
  2021 実施状況報告書

不完全情報を伴う多次元の事象時間データの推測と機械学習法

研究代表者

杉本 知之 滋賀大学, データサイエンス学系, 教授 (70324829)

4,030千円 (直接経費: 3,100千円、間接経費: 930千円)

現在までの達成度 (区分)

理由

報告書

研究成果

[雑誌論文] 2変量生存時間モデルにおけるコピュラとその利用2023

著者名/発表者名

雑誌名

DOI

ISSN

年月日

関連する報告書

[雑誌論文] 計算代数統計を用いたログランク検定2023

著者名/発表者名

雑誌名

DOI

ISSN

年月日

関連する報告書

[雑誌論文] Inference using an exact distribution of test statistic for random-effects meta-analysis2022

著者名/発表者名

雑誌名

DOI

関連する報告書

[学会発表] 2変量2値データに対する群逐次同時信頼区間について2022

著者名/発表者名

学会等名

関連する報告書

[学会発表] 多変量生存時間モデル2022

著者名/発表者名

学会等名

関連する報告書

[学会発表] 時間共変量を含むCox回帰モデルにおけるガウス過程回帰と多重代入法の利用について2021

著者名/発表者名

学会等名

関連する報告書

[学会発表] 2変量事象時間アウトカムと群逐次ログランク法について2021

著者名/発表者名

学会等名

関連する報告書

[図書] 生存時間解析2021

著者名/発表者名

総ページ数

出版者

ISBN

関連する報告書

杉本知之滋賀大学, データサイエンス学系, 教授 (70324829)