研究課題/領域番号 |
18K18009
|
研究機関 | 慶應義塾大学 |
研究代表者 |
片山 翔太 慶應義塾大学, 経済学部(三田), 准教授 (50742459)
|
研究期間 (年度) |
2018-04-01 – 2024-03-31
|
キーワード | 高次元統計的推測 / 交絡調整 / 多重比較 / 遺伝子データ解析 |
研究実績の概要 |
高次元パラメータを持つ2標本問題について,交絡調整を伴う統計的推測の研究を行なった.この研究は遺伝子データ解析への応用を目指し,2グループへの割り当てがランダムではなく,共変量に依存し得る一般的なケースを扱った.2021年度までの研究によって,高次元データに対しても適切な,最大値型検定統計量による同時検定方式を実現できたため,今年度は局所的な検定方式の構築を行なった.
特に,どの変数において2グループ間に差異が生じたのかを検証するために,高次元データにおける多重比較問題について研究を行なった.まずは高次元パラメータのひとつひとつについて交絡調整を伴う検定統計量を構築し,Liu (2013)やJavanmard and Javadi (2019)などにしたがって多重検定方式を与えた.そして,サンプルサイズと変数の次元が共に大きくなる高次元漸近枠組みの下,FDRが正しくコントロールされることを示した.しかしながら,その証明の際に,変数の次元がサンプルサイズに対して多項式のオーダーとなることを要求してしまった.証明の技術的な問題ではあるものの,これでは(超)高次元データに対して正しくFDRがコントロールされない恐れがある.そのため,数値実験によって,FDRコントロールの精度がそれほど変数の次元に依存しないことを確認した.
また,Covid-19に対する重症化患者と非重症化患者のRNA-seqデータについて,実際に上記の多重検定方式を適用した.その結果,従来手法では見つけることの出来なかった新たな遺伝子や遺伝子オントロジーを発見できた.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
当初の計画通り,交絡調整を伴う適切な高次元多重検定方式の構築と,実際の遺伝子データへの適用が完了できたため.
|
今後の研究の推進方策 |
2021年度に研究を実施した,高次元線形回帰モデルにおける2グループ間の差異検出についてさらに研究を進める.2021年度までの研究では,差異パラメータに対する直接的な推定量の提案とその推定誤差の導出を行なったが,次年度はさらに信頼区間や検定方式の構築を目指す.提案した推定量は,重みつき結果変数に対するlassoとも見なせるため,Javanmard and Montenari (2014)やZhang and Zhang (2014)などで提案されているde-baised lassoの方法に基づいて推定量からバイアスを除去し,その漸近正規性の導出を行う.
|
次年度使用額が生じた理由 |
新型コロナウイルスの影響によって,予定していた国際学会への参加がキャンセルされたために未使用額が前年度から引き続き生じている.未使用額はオンラインによる研究ミーティング環境の整備,高次元データ解析に関連する書籍の購入,論文のオープンアクセス化のための費用などにあてる.
|