研究課題/領域番号 |
22K21286
|
研究種目 |
研究活動スタート支援
|
配分区分 | 基金 |
審査区分 |
1001:情報科学、情報工学およびその関連分野
|
研究機関 | 東京医科大学 |
研究代表者 |
原田 和治 東京医科大学, 医学部, 助教 (40964036)
|
研究期間 (年度) |
2022-08-31 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
2,860千円 (直接経費: 2,200千円、間接経費: 660千円)
2023年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2022年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
|
キーワード | ロバスト統計学 / 欠測データ解析 / 統計的因果推論 / 順序回帰 / ロバスト統計 / セミパラメトリック推測 / 因果推論 |
研究開始時の研究の概要 |
本研究の目的は,外れ値を含むデータの解析(ロバスト統計)において,欠測データ解析の枠組みを適用し,新たに効率的で頑健な推定法を作ることである.データが外れ値を含む場合,例えば標本平均が想像しやすいが,本来求めたい平均値から大きくずれた値を得ることがある.従来は,外れ値を含むデータは,本当に興味のあるデータの集まりと,外れ値の集まりがそれぞれ異なる確率分布から発生し,それらが一定割合で混合されると考えてきた.しかし,この考え方では,外れ値の背後に「本当は観測されるはずだった値」が隠れている状況をうまく扱えない.この問題は欠測データの解析によく似ており,本研究はこれらの統合を目指している.
|
研究実績の概要 |
申請者である原田は,統計的因果推論における逆確率重みづけ推定量(IPW推定量)および二重頑健推定量(DR推定量)について,密度関数のべき乗で重みづけを行った推定方程式を解くことで,外れ値にも頑健な推定量への拡張を行った.この方法の特色は,外れ値の割合をKanamori and Fujisawa (2014) などを用いて推定して組み込むことにより,直感的に思いつく形では担保できなかった二重頑健性を担保することに成功している点である.数値実験により,提案手法は効果的に外れ値に対処できることが確認された.当該研究成果は2024年1月に Statistica Sinica 誌に掲載された.当該研究で得た知見は,欠測データ(統計的因果推論)の枠組みと外れ値への頑健性を結びつける重要なアイデアにつながっている.申請者は引き続き検討を進め,欠測データの枠組みから外れ値に頑健な推定量を捉えなおす試みについて,理論的検討やシミュレーション実験を通して,課題の理解と解決に向けて研究を進める計画である.問題に対する理解が進み,外れ値の形態やEstimandの整理を行っているものの,当初の想定よりも進行が遅れており,1年の延長を申請した.
また,ロバスト統計の観点からは前年に続き順序回帰方向での検討も進め,Okuno and Harada (2023) が計算機統計学の雑誌に採択された. なお統計的因果推論および欠測データ解析の観点で,バイアスのない推定のためには適切な共変量調整が不可欠であるが,調整変数の選択において偽発見率を制御する研究に取り組み,プレプリントの公開及び計量生物学会年会での発表を行った.当該結果はプレプリントとして公開済みである.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
申請時には査読中であった論文が,Major Revision を経て,本年度中に公開に至ったものの,新環境に不慣れであった部分もあり,本研究の中心的課題である欠測データの枠組みから再解釈する試みについては,具体的な成果(学会発表,論文投稿)につなげられていない.しかし,順序回帰や変数選択方面での研究をはじめ,ロバスト統計の手法に関する理解は当初より深まっている.
|
今後の研究の推進方策 |
欠測データの枠組みから再解釈する試みについては,具体的な成果(学会発表,論文投稿)につなげられるよう,理論的検討やシミュレーション実験を推し進める.
|