2021 Fiscal Year Research-status Report
Project/Area Number |
18K18009
|
Research Institution | Keio University |
Principal Investigator |
片山 翔太 慶應義塾大学, 経済学部(三田), 准教授 (50742459)
|
Project Period (FY) |
2018-04-01 – 2023-03-31
|
Keywords | 高次元線形回帰 / スパース推定 / 因果推論 / 高次元検定 |
Outline of Annual Research Achievements |
高次元線形回帰モデルにおける2グループ間の差異検出について,予測誤差に関する最適性の研究をおこなった.前年度までに構築した推定量が,予測誤差の意味でどの程度「良い」のか,理論的に検証するためである.具体的には,傾向スコアが既知の場合において,予測誤差のminimax最適な収束レートを導出し,比較・検証を進めた.提案した推定量は傾向スコアを未知として導出しているため,その収束レートはminimax最適なものよりも少し悪くなるものの,両者の差を規定するパラメータを明確にすることができた.
一方で,高次元パラメータを有する2標本問題についての研究も進めた.ただし,遺伝子データ解析への応用を目指し,2グループへの割り当てが共変量に依存するケースを扱った.遺伝子データ解析の文脈では,疾患の有無などでグループが構成されており,ランダムな割り当ての想定は実質的に不可能である.また,遺伝子データはその測定法によって連続・カウント・2値など多様な結果変数を有する.前年度に求めた同時検定統計量は,連続値を持つ結果変数のみを扱っていたため,まずはこれを拡張し,統一的な検定統計量へと再構築した.具体的には,各結果変数に対して一般化線形モデル,傾向スコアにロジスティック回帰モデルを想定し,2グループ間の差異を規定する高次元パラメータに対する最大値型検定統計量を構築した.そしてその検定統計量が,高次元漸近枠組み(サンプルサイズと変数の次元が共に大きくなる)において,ガンベル型の分布へと分布収束することを示した.これにより,高次元データにおいて2グループ間の差異を検出するための,適切な検定方式を実現することができた.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初予定していた通り,高次元線形回帰モデルにおける2グループ間の差異検出について,予測誤差のminimax最適な収束レートの導出を完了させ,さらに,高次元パラメータを有する2標本問題についても一定の結果を得たため.
|
Strategy for Future Research Activity |
高次元パラメータを有する2標本問題について引き続き研究を進める.今年度に得られた同時検定方式ではどの結果変数について差異が生じたのか分からない.そこで,局所的な差異を検出するための多重検定方式の構築を目指す.高次元パラメータのひとつひとつについて検定統計量を構成し,高次元漸近枠組みの下でfalse discovery rate等が適切にコントールできるような検定方式を導出する.その後,実際の遺伝子データに適用し,新たな知見の獲得を目指す.具体的には,新型コロナウイルスに対する重症化患者と非重症化患者についての遺伝子データ解析を行う.
|
Causes of Carryover |
新型コロナウイルスの影響により,当初予定していた海外出張がキャンセルされ,それによって未使用額が生じた.未使用分は,実際の高次元データ解析を行うための高性能PCの購入費や,オープンアクセス費用に当てる.
|