遺伝子の変異がもたらすタンパク質の構造変化やエピジェネティクスなど、細胞内の様々な効果が組み合わさることで、疾患発症やストレス耐性機構などの生命現象が起こる。これらの相乗効果を明らかにするため、近年、ゲノムデータやトランスクリプトームデータなどのオミクスデータを複数個繋ぎ合わせたマルチオミクス解析が期待されている。しかし、このような解析は複数のオミクスデータを組み合わせるとその大きさが非常に膨大になるために難しく、有効な統計解析手法は存在しない。このため、本研究では、オミクス層を越えた相乗効果の網羅的な解析を阻む2つの問題、膨大な計算時間と既存の多重検定補正法の低い検出力を同時に解決する統計解析手法を開発する。この目標に向けて、本年度は主に以下の二つのことに取り組んだ。 (1) 複数のデータを同時に解析できる多重検定補正法の開発:マルチオミクス解析のような複数個を統合したデータから相乗効果の検出を可能にするため、無限次数多重検定補正法(LAMP)を高度化した。このために、層化されたデータの解析で用いられる手法の一つであるロジスティック回帰を用いた検定を用いて、相乗効果を網羅的に検出できるようにLAMPのアルゴリズムを改良した。 (2) Westfall-Young法の高速化法の開発:Westfall-Young法(WY法)は検出力の高い多重検定補正法の一つであるが、これをマルチオミクス解析へ応用すると現実的な計算時間では解析不可能であった。このため、本研究ではGPGPUを用いた並列処理により、WY法を高速に計算する手法を開発した。本手法をゲノムワイド関連解析に応用した結果、WY法と同じ結果を約1000倍高速に得られた。
|