研究実績の概要 |
遺伝子発現行列 (薬剤×遺伝子発現) という連続量を直接処理するために、例えば、ChIP-seq 実験から転写因子の標的遺伝子 (遺伝子×転写因子結合) を定義し、これらの標的遺伝子が投薬/対照群の遺伝子発現プロファイルのどちらにエンリッチするか を検定する方法が考えられる (normal GSEA)。ところが、遺伝子×転写因子結合は 「結合する/しない」で抽象化されるため、結合強度が異なる場合でも同等に「結合 している」とだけ見なされてしまう。したがって、本研究では遺伝子×転写因子結合に対し、ゲノムへのリードアライメントの集積程度を表す統計量 (MACS2 score) を転写因子結合強度と定義し、それによる重み付けを行う手法を考案した (ChIP-weighted GSEA)。LINCS L1000 の薬物摂動トランスクリプトームデータを入力し、AUROC score を利用した精度評価により、薬物の直接的な作用標的の同定における提案手法の有効性を確認した (ChIPEA, 0.60; normal GSEA, 0.61; ChIP-weighted GSEA, 0.66)。さらに,DisGeNET を利用し、薬物と疾患をリンクさせるマスターレギュレータの予測を行った (ChIPEA, 0.63; normal GSEA, 0.62; ChIP-weighted GSEA, 0.68)。
|