2022 Fiscal Year Research-status Report
Research on nonlinear regression models for estimating treatment effects in clinical cancer research
Project/Area Number |
22K11937
|
Research Institution | Wakayama Medical University |
Principal Investigator |
下川 敏雄 和歌山県立医科大学, 医学部, 教授 (00402090)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Keywords | アンサンブル樹木法 / 治療効果モデル / Meta-learner / 異質性治療効果 / サブグループ同定法 |
Outline of Annual Research Achievements |
今年度は,既存の治療効果モデルの整理を中心に行なった.そこでは,治療効果モデルの前身と捉えることができるサブグループ同定法(Subgroup identification method)の整備から始まり,そこから治療効果モデルに発展したプロセスを整備した.また,既存の治療効果モデルを(1) 樹木構造接近法に基づく方法,(2) Meta-learner,に分けたうえで整理した.加えて,既存の治療効果モデルの特徴を数値検証で検証するとともに,それらの適応上の留意点について検討した.さらに,結果の解釈を支援するためのグラフィカル表現法について検討した.その研究成果について,日本計算機統計学会論文誌「計算機統計学」に投稿した. また,共有基底条件付き平均回帰(SCMR; Shared basis conditional mean regression, Powers et al., 2018)の概念のもとルール・アンサンブル法(Firedman & Popescu, 2008)に拡張した.SCMRでは,新規治療群と既存治療群のそれぞれで同じ基底関数を持つことを仮定するが,提案手法では,これらの基底関数に対する回帰パラメータの推定と刈込みを行うために,Group lasso法(Bakin, 1999)を用いた.この提案手法について,Statistics in Medicineにおいて採択された.同様の発想のもと,多変量適応型回帰スプライン(MARS)法のアンサンブル学習法版である,Bagging MARS法を拡張した.この提案手法については,日本計算機統計学会 第36回シンポジウムで発表した. さらに,研究動向の把握および生物統計家の交流を意図して,「第2回かごしまデータ科学シンポジウム」ならびに「第3回かごしまデータ科学シンポジウム」を開催した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
2022年度の位置づけは,治療効果モデルをとりまく現況を把握することにあった.その理由は,治療効果モデルが,統計科学および機械学習のそれぞれの分野で開発されており,(1)条件付き回帰手法とT-learnerなど,同じ治療効果モデルであるにも関わらず,異なる用語が用いられる(研究分野による壁),(2) 当初,サブグループ同定法として開発されていた方法が治療効果モデルとして扱われるようになっている(時代による壁),が存在するため,各手法が錯綜していたためである.そのため, 2022年度は,それらの手法を定式化することが目標であった.この目標を達成するために,2000年代から最近の研究論文をレビューすることから始めるとともに,プログラミングを含めた整備を行った.その成果を日本計算機統計学会誌「計算機統計学」に投稿することができた.投稿が2022年度終盤であったため,査読中であるものの,整備が完了したことは成果といえると考えられる. 次いで,新たな治療効果モデルの開発については,多くの治療効果モデルと同様に,連続応答のもとで行った.そこでは,共有基底条件付き平均回帰を拡張する形式で,因果RuleFit法を提案するとともに,Statistics in Medicineに採択されるに至った.本来は,2023年度中に投稿する予定だったが,いち早く採択されたことは,今後,生存時間応答に対する拡張に弾みがつくものと期待している. 治療効果モデルは,非常に新しい方法であり,その用途開発については,米国を中心に進んでいるが,本邦ではほとんど行われていない.そのため,2度のシンポジウムを主宰するとともに,意見交換を行った.このときに得られた知見は,新たな手法開発の動機に繋がると考えている.
|
Strategy for Future Research Activity |
2023年度は連続変数応答に加えて,生存時間データに対する治療効果モデルを開発する. 連続変数応答に対する治療効果モデルについて,2022年度は,T-learnerを改良することで構成される共有基底条件付き平均回帰に基づく方法を開発した.他方,治療に拠らないアウトカムへの影響(主効果)が考慮できるMeta-learnerは,S-learnerしか存在しない.他方,S-learnerでは,HTEに対する統計モデルを構築できない.そのため,S-learnerを主効果および治療×共変量交互作用の基底関数を選定するために用い,交互作用については,試験治療×共変量,既存治療×共変量の二つの交互作用に分けたうえで,group lassoを用いて回帰パラメータを再推定する2段階推定法(基底関数推定過程,回帰パラメータ推定過程)に基づく,治療効果モデルに対する新たなフレームワークを構築する. 次いで,生存時間データに対する治療効果モデルの開発に着手する.生存時間データに対するHTEの推定には,年次生存率の差,対数ハザードの差(ハザード比),中央生存時間の差,境界内平均生存期間(RMST)の差などが考えられ,既存の治療効果モデルにおいては,いずれかの「差」に基づいて提案されている.本研究では,対数ハザード比の差に基づいて,Cox比例ハザードモデルの枠組みのもとで,共有基底条件付き平均回帰に基づく因果生存時間Bagging MARS法を開発する.次いで,上述のS-learnerの修正手法においては,RuleFit法(Friedman & Popescu, 2008)のもと,生存時間解析に拡張する.さらに,RMSTに対する治療効果モデルについても検討する.
|
Causes of Carryover |
本研究では,実際のRWDに対する利活用を想定している.そのなかの候補の一つが,中国 四川大学との共同研究(周産期疾患に対するRWDの構築)である.2022年度は,新型コロナウイルス感染症の影響で,中国の水際対策措置の影響で,研究打ち合わせのための中国への渡航ができなかった.そのため,2023年度前半に共同研究の打ち合わせとともに,RWDを使用するための匿名化,規制当局の状況等について打ち合わせを行う予定である.
|