研究概要 |
細胞の増殖・分化・リプログラミングなど, 細胞の状態制御のメカニズムを明らかにするため, 複数種類の転写因子の組合せ効果による機能を発見することが重要である, しかし, 転写因子の種類数に対して考え得る組合せの数は指数関数的に増加するため, ゲノムワイドに転写因子の組合せを調査することは, 実験科学的に不可能なだけではなく, 計算機を用いた解析でさえ膨大な計算時間を要するため難しい. 仮に, 網羅的な調査が可能だとしても, Bonferroni補正に代表される多重検定補正の低い検出力が, 計算機的・統計的な解析結果と生物学的に得られている知見との間に乖離を生じている. これまでに, 膨大な計算時間と多重検定補正法の低い検出力を同時に解決する方法が無いため, 本研究では, 新たな多重検定補正手法を開発することで, 転写因子の組合せ効果による機能を明らかにする. 本年度は, 転写因子の組合せの効果を発見できる新たな多重検定補正法LAMP (Limitless Arity Multiple testing Procedure)を開発した. Bonfbrroni補正では全ての組合せが偽陽性を生じると見なして偽陽性の生起確率を見積もるのに対し, LAMPは出現頻度が低い転写因子の組合せが偽陽性には成り得ない性質を利用することで, Bonferroni補正よりも正確に偽陽性の生起確率を計算できるため, 検出力が高い手法である. 更に, この性質と頻出パターン解析で用いられている効果的な枝刈りアルゴリズムを組合せる事で, ゲノムワイドなデータであっても網羅的な転写因子の組合せの調査が可能となった. LAMPでヒトの乳がん細胞株の遺伝子発現データを解析した結果, 最大8個の転写因子の組み合わせが乳がん細胞の増殖に関与していることを発見した. この組合せはBonferroni補正では検出できないものであった.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
新たな多重検定補正手法LAMPの開発に成功し, 疑似データやヒトの乳がん細胞株の発現データなどを解析することで, LAMPがBonferroni補正よりも高い検出力を有することを確認した, その一方で, LAMPでも偽陽性を過剰に見積もっていることも明らかとなった. 本年度中にその解決策も検討しているため, 来年度はLAMPの改良に着手できると考えている。従って, 研究は概ね順調に進展している.
|
今後の研究の推進方策 |
LAMPが偽陽性を過剰に見積もる問題を解決するため, permutationテストを利用した多重検定補正手法の開発を検討する. permutationテストは, 検定数が少ない場合でさえ膨大な計算時間を要するため, 検定数が転写因子の種類数に対して指数関数的に増加する組合せの網羅的な調査では, 計算時間の面での問題が致命的になる. この問題に対し, まずはLAMPで利用した頻出パターン解析の効率的な枝刈りアルゴリズムの応用する手法の開発を検討する. この方針で十分な高速化が見込めない場合, permutationテストの並列化による高速化を検討する.
|