• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

欠測データ解析の枠組みに基づく外れ値のモデル化と偏りがなく効率的な推定量の開発

研究課題

研究課題/領域番号 22K21286
研究種目

研究活動スタート支援

配分区分基金
審査区分 1001:情報科学、情報工学およびその関連分野
研究機関東京医科大学

研究代表者

原田 和治  東京医科大学, 医学部, 助教 (40964036)

研究期間 (年度) 2022-08-31 – 2025-03-31
研究課題ステータス 交付 (2023年度)
配分額 *注記
2,860千円 (直接経費: 2,200千円、間接経費: 660千円)
2023年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2022年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
キーワードロバスト統計学 / 欠測データ解析 / 統計的因果推論 / 順序回帰 / ロバスト統計 / セミパラメトリック推測 / 因果推論
研究開始時の研究の概要

本研究の目的は,外れ値を含むデータの解析(ロバスト統計)において,欠測データ解析の枠組みを適用し,新たに効率的で頑健な推定法を作ることである.データが外れ値を含む場合,例えば標本平均が想像しやすいが,本来求めたい平均値から大きくずれた値を得ることがある.従来は,外れ値を含むデータは,本当に興味のあるデータの集まりと,外れ値の集まりがそれぞれ異なる確率分布から発生し,それらが一定割合で混合されると考えてきた.しかし,この考え方では,外れ値の背後に「本当は観測されるはずだった値」が隠れている状況をうまく扱えない.この問題は欠測データの解析によく似ており,本研究はこれらの統合を目指している.

研究実績の概要

申請者である原田は,統計的因果推論における逆確率重みづけ推定量(IPW推定量)および二重頑健推定量(DR推定量)について,密度関数のべき乗で重みづけを行った推定方程式を解くことで,外れ値にも頑健な推定量への拡張を行った.この方法の特色は,外れ値の割合をKanamori and Fujisawa (2014) などを用いて推定して組み込むことにより,直感的に思いつく形では担保できなかった二重頑健性を担保することに成功している点である.数値実験により,提案手法は効果的に外れ値に対処できることが確認された.当該研究成果は2024年1月に Statistica Sinica 誌に掲載された.当該研究で得た知見は,欠測データ(統計的因果推論)の枠組みと外れ値への頑健性を結びつける重要なアイデアにつながっている.申請者は引き続き検討を進め,欠測データの枠組みから外れ値に頑健な推定量を捉えなおす試みについて,理論的検討やシミュレーション実験を通して,課題の理解と解決に向けて研究を進める計画である.問題に対する理解が進み,外れ値の形態やEstimandの整理を行っているものの,当初の想定よりも進行が遅れており,1年の延長を申請した.

また,ロバスト統計の観点からは前年に続き順序回帰方向での検討も進め,Okuno and Harada (2023) が計算機統計学の雑誌に採択された.
なお統計的因果推論および欠測データ解析の観点で,バイアスのない推定のためには適切な共変量調整が不可欠であるが,調整変数の選択において偽発見率を制御する研究に取り組み,プレプリントの公開及び計量生物学会年会での発表を行った.当該結果はプレプリントとして公開済みである.

現在までの達成度 (区分)
現在までの達成度 (区分)

3: やや遅れている

理由

申請時には査読中であった論文が,Major Revision を経て,本年度中に公開に至ったものの,新環境に不慣れであった部分もあり,本研究の中心的課題である欠測データの枠組みから再解釈する試みについては,具体的な成果(学会発表,論文投稿)につなげられていない.しかし,順序回帰や変数選択方面での研究をはじめ,ロバスト統計の手法に関する理解は当初より深まっている.

今後の研究の推進方策

欠測データの枠組みから再解釈する試みについては,具体的な成果(学会発表,論文投稿)につなげられるよう,理論的検討やシミュレーション実験を推し進める.

報告書

(2件)
  • 2023 実施状況報告書
  • 2022 実施状況報告書
  • 研究成果

    (5件)

すべて 2024 2023 2022

すべて 雑誌論文 (2件) (うち査読あり 2件) 学会発表 (3件) (うち国際学会 1件)

  • [雑誌論文] An Interpretable Neural Network-based Nonproportional Odds Model for Ordinal Regression2024

    • 著者名/発表者名
      Akifumi Okuno, Kazuharu Harada
    • 雑誌名

      Journal of Computational and Graphical Statistics

      巻: - 号: 4 ページ: 1-10

    • DOI

      10.1080/10618600.2024.2321208

    • 関連する報告書
      2023 実施状況報告書
    • 査読あり
  • [雑誌論文] Outlier-Resistant Estimators for Average Treatment Effect in Causal Inference2024

    • 著者名/発表者名
      Harada Kazuharu、Fujisawa Hironori
    • 雑誌名

      Statistica Sinica

      巻: 34

    • DOI

      10.5705/ss.202021.0254

    • 関連する報告書
      2022 実施状況報告書
    • 査読あり
  • [学会発表] 階層的順序アウトカムに対する順序ロジットモデルと罰則つき最尤法2023

    • 著者名/発表者名
      原田和治
    • 学会等名
      2023年度日本計量生物学会年会
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] Modeling and estimation for hierarchical ordinal outcome2023

    • 著者名/発表者名
      Kazuharu Harada
    • 学会等名
      44th Annual Conference of the International Society for Clinical Biostatistics (ISCB44)
    • 関連する報告書
      2023 実施状況報告書
    • 国際学会
  • [学会発表] 平均因果効果の外れ値にも頑健な二重頑健推定量2022

    • 著者名/発表者名
      原田和治,藤澤洋徳
    • 学会等名
      日本計量生物学会年会
    • 関連する報告書
      2022 実施状況報告書

URL: 

公開日: 2022-09-01   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi