研究実績の概要 |
ゲノムワイド関連解析により、様々な疾患と関連する多数の一塩基多型(SNP)が同定されたが、疾患機序の解明には殆どつながっていない。疾患機序を解明するためには、疾患関連SNPが、どの組織において細胞状態に影響するかを明らかにする必要がある。 本研究では、疾患関連SNPが各種の細胞のエピジェネティックな状態に与える影響を予測する統計モデルを構築し、実験検証する。これまで別分野で行われてきた、eQTL/mQTL解析とエピゲノム解析のデータを組み合わせることにより、SNPと細胞のエピジェネティック状態を関連づける。 本年度は、単独SNPによる各種細胞のエピジェネティック状態変化を予測するモデルの構築に取り組んだ。 データは、ArrayExpress, database of Genotypes and Phenotypes, European Genome-phenome Archive, European Nucleotide Archive, Gene Expression Omnibus などの公開データを利用した。ヒトおよびラットについて、SNP、DNAメチル化、ヒストン修飾、mRNA発現のデータを収集した。統一的なデータクリーニングを行い、Rのパッケージを利用しつつ、クラスタリングなどの統計解析を行った。 ヒトにおけるT細胞、脳、胎盤のCpGメチル化率の分散については、71%が組織差、2%が人種差、0~15%が近傍のSNP(mQTL)で説明できた。従って、仮に単一の組織のみを解析できた場合には、SNPで説明できる割合が0~52%に上昇するはずである。この結果は、CpGメチル化率とSNPの研究において、不均一な検体が悪影響を及ぼすことを示している。
|