本研究では、転写因子の相乗効果の統計的な解析において直面する、多重検定補正法による低い検出力と膨大な計算時間を改善するため、無限次数多重検定法(Limitless Arity Multiple testing Procedure; LAMP)を平成25年度に開発した。ところが、LAMPを実験データの解析へ応用すると、高速化が不十分で解析が難しいことが多かった。このため、平成26年度は、深さ優先探索でLAMPと同じ結果を求めるアルゴリズムを開発することで、従来の幅優先探索を行うLAMPに比べて、100倍以上の高速化を達成した。高速化したソフトウェアは、http://www.seselab.org/lampにて公開している。 高速化したことで、より大規模なデータが扱えるようになり、転写因子の組み合わせの効果の検出だけではなく、他の問題へLAMPを応用することが可能となった。その一例として、疾患関連遺伝子の同定などのためによく行われているゲノムワイド関連解析(GWAS)へLAMPを応用した。GWAS解析では、GWASデータに加えてタンパク質間相互作用ネットワークなどのグラフ構造も利用した解析が有効である。このため、グラフ構造を扱えるようLAMPを改良し、有意な部分グラフを列挙するアルゴリズムgLAMPを開発した。gLAMPを用いてシロイヌナズナのGWAS解析を行った結果、開花時期の違いに有意に関わる3個のSNPsの相乗効果を検出した。 本年度は、LAMPの高速化とGWAS解析への応用例を作ることで、LAMPがより様々な研究で用いられる可能性を高めることができた。
|