2021 Fiscal Year Research-status Report
異質な集団を含むデータに対する統計的学習理論を用いたモデル開発と臨床医学への応用
Project/Area Number |
18K11197
|
Research Institution | Keio University |
Principal Investigator |
林 賢一 慶應義塾大学, 理工学部(矢上), 准教授 (70617274)
|
Project Period (FY) |
2018-04-01 – 2023-03-31
|
Keywords | 二値回帰モデル / ROC / IDI / odds-IDI / power-IDI |
Outline of Annual Research Achievements |
本研究の目的は,異質な部分集団によって構成されるデータに対し,「予測力(説明力)」と「解釈可能性」が両立する統計的方法の構築に寄与することである.本年度は,二値回帰モデルに対する方法論として,(1) power-IDIの問題点を解決する新たな指標,(2) 臨床試験におけるエンドポイントに欠測がある場合の共変量調整によるリスク差の推定法を検討した. (1)は,新しい共変量を追加することによってモデルの予測性能が改善するかを評価する問題である.この場合にROC曲線の下側面積を比較・評価することが多いが,これは予測量の順序に基づくため検出力が低い.また,Pencina et al. (2008)は感度と特異度の積分値に基づくIDI(integrated discriminant index)を提案したが,過剰な誤検出の可能性が様々な文献で指摘されている.そこで,応答の予測確率のオッズに基づく,上記に代わる新しい指標を構築・提案した.提案する指標はFisher一致性を備えており,過去に提案した指標(Hayashi and Eguchi, 2019)の解釈の難しさやハイパーパラメータの設定という問題を克服している. (2)は,無作為化比較試験において二値変数のアウトカムに欠測が生じる状況を考える.Mukaka et al. (2016)は完全ケース解析(complete case analysis)と欠測値の多重代入法(multiple imputation method)を比較しているが,主要な推定対象であるリスク差の一致推定にはそれぞれ制約の強い仮定が要求される.これを踏まえ,Van Lanker et al. (2020)の方法に基づき,欠測値の存在下で共変量を用いたリスク差の推定方法を検討した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
昨年度は新型コロナウイルス感染症の問題による進捗の遅延があった.そのため,期間の延長を行ったが,今年度は前年度の遅れを取り戻したと考えられる.実績の概要で述べた方法については,(1)は学術論文の投稿準備が整い,(2)は学会での発表が準備されている.
|
Strategy for Future Research Activity |
本年度の方針を継続し,より一般化線形モデルに対する課題解決に繋げたいと考えている.また,適応的インデックスモデル(Tian and Tibshirani, 2010)のような特殊な回帰モデルに対しては,odds-IDIなどが有するFisher一致性は強すぎる性質と考えられるので,これの性質を緩和し,より解釈可能性に特化した指標の構築にも取り組みたい.合致したクラスタワイズ回帰モデルに基づく統計モデルの再検討も行う.これは,昨年度に検討課題とした不連続な挙動を許容するようなモデルを含んだ拡張にも関連する.
|
Causes of Carryover |
新型コロナウイルス感染症の影響が前年度より続き,国際学会への参加取り止めやオンライン開催への変更により,想定された旅費が未使用となったため. (使用計画) 国際学会や国内の研究集会,または研究討論のための旅費として利用する.また,研究環境の改善を引き続き実施し,オンラインの対応だけでなくハイブリッド形式で実施される研究集会や研究打ち合わせにも対応できるように物品の購入も行う.本年度に引き続き,資料整理の依頼に対する謝金,論文の英文校正のための支出,さらにはオープンアクセス形式での論文出版も計画している.
|
Research Products
(3 results)