観察研究において関心の治療の効果を適切に推定するためには,研究対象者における膨大な特性情報を考慮する必要がある.膨大な特性情報の複雑な構造を考慮した上で適切な治療効果を推定するために,近年では機械学習を応用した因果推論手法が提案されている.本課題では特にdouble/debiased machine learning(DML)推定量に焦点を当てて研究を実施した. 膨大な特性情報の存在下では,治療効果の推定に役立つ情報の取捨選択が関心ごとの一つとなる.従来の機械学習手法では必ずしも治療効果の適切な推定に役立つ情報が選択され考慮される保証はないという懸念点がある.この課題を克服するために,前年度までは結果適応的機械学習モデルを活用することで,より治療効果を適切に推定できる変数選択を実現する手法を提案し,コンピュータシミュレーションによって種々の状況下においてそのパフォーマンスを従来法と比較した.その成果は国際学術誌に採録された. 続いて昨年度から今年度にかけては,前年度で取り組んだ変数選択に関する手法論を基盤として,適切な変数選択を実現する機械学習選択の方法論に取り組んだ.機械学習手法は数多存在するため,それぞれのデータに応じて適切な機械学習手法を選択することは,分析実施上の課題の一つとなる.特に膨大な特性情報の存在下では,用いる機械学習手法によって取捨選択される情報も異なり,用いる機械学習手法によって結果が大きく変化しうる.この課題を克服するために,前年度から今年度にかけては,各状況下において適切な変数選択を実現する機械学習手法を選択するための手法論に取り組んだ.従来のモデル選択手法と比較した際の状況別の有用性を,コンピュータシミュレーションによって評価し,その結果は国際学術誌に採録された.
|