2018 Fiscal Year Annual Research Report
Genetic prediction modeling that accounts for correlation structure in large-scale genomic data
Project/Area Number |
16K00064
|
Research Institution | Institute of Physical and Chemical Research |
Principal Investigator |
植木 優夫 国立研究開発法人理化学研究所, 革新知能統合研究センター, 研究員 (10515860)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | ゲノムワイド関連解析 / 遺伝子×環境相互作用解析 |
Outline of Annual Research Achievements |
大規模集団コホートを用いて、ゲノム情報や様々な臨床・健康情報の間の関係を調べる研究が各国で進められている。SNP(単一塩基多型)や全ゲノムインピュテーションデータ、全ゲノムシークエンスデータは、数十万から数千万もの変数からなる超高次元なゲノムデータであり、数万人もの参加者に付随する健康情報との関連性を調査することが求められる。GWAS(ゲノムワイド関連解析)は、各バリアントと興味ある疾患や量的形質間の関連を統計的に調べる手法であるが、超高次元かつ大サンプルサイズのデータにおいては、統計解析に要する計算コストは多大であり非常に深刻である。
各バリアントと各形質との間の関係を、単純に一変量回帰によって調べるスクリーニングがGWASでは標準的に用いられているが、大規模サンプルでの計算は高コストとなる。この状況は、高次元の共変量を調整する際に特に深刻となる。 今回、尤度比検定やワルド検定に比べて計算が高速となるスコア検定について研究を行った。GWASでのゲノムワイド探索において、ゲノム情報に含まれる欠測パターンの違いに起因する計算負荷が存在していたが、このボトルネックを漸近理論を用いて解消し、スコア検定のさらなる高速化を達成することに成功した。本手法は、GWASのみならず、遺伝子×環境相互作用解析(GxE)にも利用可能な一般的な形式となっている。数値実験と実データ適用によって提案法の有用性を確認することができた。得られた成果は論文として発表した(Sato and Ueki 2018 PLoS ONE)。
|
Research Products
(9 results)