Research Project
Grant-in-Aid for Young Scientists (Start-up)
・計算機環境の構築本研究を遂行するにあたって、まず計算機環境の構築を行なった。比較ゲノム解析により非コード領域中の配列モチーフを探索するには、ゲノムアライメントの解析が必須となる。そのデータ量は膨大なもので(約44ギガバイト)、それに対応したディスク容量とメモリーの実装が必須である。これを踏まえ、本研究計画に適した計算機環境(ディスク容量1テラバイト;メモリー4ギガバイト)を構築した。・ゲノムアライメント操作のためのプログラム作成本研究は非コード領域に存在する転写因子結合部位やスプライシング制御因子などの配列モチーフを比較ゲノム解析により検出し、それらのゲノム中での高精度なアノテーションを行なうことを目的としている。そのためには、まず、ゲノムアライメントをもとにした解析により、非コード領域で局所的に保存しているパターンの同定を行なう必要がある。ただし、生物種特異的なゲノム再編成(genome rearrangements)のために、ゲノムアライメントは非常に細かく断片化している(平均長:約120塩基)。本年度は、このようなゲノムアライメントを操作することで、ある生物種について一繋がりのアライメントに再構築するためのプログラム開発を行なった。このプログラムにより、任意のゲノム領域について生物種間の比較が可能となった。これは、配列モチーフの検出のみならず、比較ゲノム解析全般において広く活用できるものである。