2017 Fiscal Year Research-status Report
大規模ゲノムデータの相関構造を考慮した遺伝的予測モデリング
Project/Area Number |
16K00064
|
Research Institution | Institute of Physical and Chemical Research |
Principal Investigator |
植木 優夫 国立研究開発法人理化学研究所, 革新知能統合研究センター, 研究員 (10515860)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | 統計遺伝学 / 遺伝疫学 / 遺伝的予測モデリング / ゲノムワイド関連解析 |
Outline of Annual Research Achievements |
GWAS(ゲノムワイド関連解析)データや、さらに大規模かつ網羅的なWGS(全ゲノムシーケンシング)データが取得されるようになっている。それに加えて、多種多様な臨床情報も同時に取得されることも多い。これら超高次元データの統計解析は喫緊の課題である。近年では、多くの被験者を収集するゲノムコホートが世界各地で設立されつつあり、サンプルサイズが非常に大きいことによって統計解析にかかる計算コストも深刻な問題となっている。そのため、複雑な統計手法を利用することはしばしば困難であり、適用可能な手法は限定される。しかしながら、高精度な予測を行うためには、既存の手法では未だ不十分であり、さらなる研究が必要となる。数十万~数千万のバリアントを同時に解析することは難しく、代わりに、各バリアントごとの解析が利用されることが多い(単点解析)。各バリアントごとに一変量回帰を適用した事前スクリーニングは、予測モデルの次元削減としてよく行われるが(Purcell et al. 2009; Ueki and Tamiya 2016)、ゲノムコホートのような大規模データでは未だに計算量の問題が大きい。 そこで、単点解析に用いる統計量をより詳細に理論的に検討し、計算量を抑えつつ検出力を本質的に改善する方法を模索した。 尤度比検定や、Wald検体に比べて高速計算が可能なスコア検定に着目し、偏相関係数との同値性からFisherのZ変換を適用し、検出力を向上させる手法を考案した。数値実験と実データ適用によって提案法の有用性を確認することができた。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
統計手法を新規に開発した。
|
Strategy for Future Research Activity |
今後、開発した手法を実データに適用し、解析を行っていく。 手法のさらなる改善に取り組む。
|
Causes of Carryover |
次年度に論文出版費用が必要となる可能性が生じたため、費用を確保するために未使用額が発生した。この未使用額は次年度に使用する予定である。
|
Research Products
(7 results)