研究概要 |
比較ゲノムシステムMurasakiの並列化とそれによってヒトを含む霊長類ゲノムの3種比較を全染色体丸ごと比較することが可能になった.比較ゲノムシステムMurasakiは従来のシステムに比べて優れた性能を発揮したが,1 CPUを使った計算では残念ながらヒトの一本の染色体の大きさまでが比較の限界であった.そこで,24本の染色体全部を丸ごと比較することができるようにするために,クラスターマシンと呼ばれる数十から数百,数千のCPUを並列に同時に動かすことのできる計算機を用いて,ヒトゲノム比較などの非常に大きな仕事を多数のCPUに分散して手分けして処理する仕組みを開発した.多数のCPUを用いることにより高速化されると同時に,使用できるメモリの容量が増えることにより高スケール化できたことが最大のポイントである. 次に, Murasakiにより検出されたアンカーからシンテニー領域を計算するアルゴリズムを開発して,それに基づいて哺乳類ゲノムのゲノム再編成解析を行った.ヒト,チンパンジー,アカゲザル,イヌ,マウス,ラット,オポッサムの7種に対して再編成に基づく系統樹を計算した.再編成に基づく進化系統樹は,霊長目と食肉目のクレイドに対して,げっ歯目は遠縁であることを示した. 一方,機能性RNAの解析のための新たなアルゴリズムやシステムの開発も積極的に行った.サポートベクターマシンを用いて機能性RNA配列の識別と探索を行うために,新しくカーネル関数を設計して,RNAファミリーの識別に関する計算機実験を行い,さらにこの手法を適用して線虫ゲノム上のsnoRNAを網羅的に予測した.
|