研究課題/領域番号 |
24310142
|
研究種目 |
基盤研究(B)
|
研究機関 | 東京工業大学 |
研究代表者 |
伊藤 武彦 東京工業大学, 大学院・生命理工学研究科, 教授 (90501106)
|
研究分担者 |
丸山 治彦 宮崎大学, 医学部, 教授 (90229625)
野口 英樹 国立遺伝学研究所, 先端ゲノミクス推進センター, 特任准教授 (50333349)
|
研究期間 (年度) |
2012-04-01 – 2015-03-31
|
キーワード | ゲノム情報 / アセンブラ / 遺伝子予測 |
研究概要 |
近年のシークエンス技術の進歩により、次世代シークエンサを用いた新規ゲノム解読が比較的容易に試みられるようになってきている。しかし成功を収めているのは、従来からのモデル生物や近交系が確立した生物に限定され、野生種など多くの生物のゲノム解読は、ヘテロ接合性の高さに起因しアセンブルがうまく行かず、行き詰まっているのが現状である。そこで、本研究ではヘテロ接合性の高いゲノムに適応したshort-read向けアセンブラ/および遺伝子予測パイプラインを開発することを第一の目的としている。 本年度は、まずdebruijnグラフアルゴリズムを用いたshort-read向け新規denovoアセンブラを開発し、そのcontig作成ルーチンに、ヘテロ接合性に起因して生じるbubble構造を許容するアルゴリズムを組み込んだプロトタイプ版を完成させた。シミュレーションデータを用いたベンチマークでは、他の既存アセンブラよりもより繋がっている事が確認された。また、高ヘテロ接合性ゲノムでの実データによるベンチマークに用いる「正解」データを作成するためベネズエラ糞線虫ゲノムからFosmidクローンの作成を実施した。次年度以降実際のシークエンスに着手する予定である。 一方遺伝子予測パイプラインの構築にも着手し、まずは真核生物遺伝子予測を汎用的に実施可能となる基本的なプログラムの実装を実施した。次年度以降RNA-seqデータ等の組み込みを図って行く予定である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
第一の目標である高ヘテロ接合性ゲノム向けアセンブラのプロトタイプ版が完成していることから進捗はおおむね順調であると言える。
|
今後の研究の推進方策 |
今後は、本年度開発したプログラムをベースにさらによくアセンブルが可能となるように様々な改良を施して行くとともに、正解データの作成を図る事で精度の検証を行って行く予定である。遺伝子予測に関しても同様である。
|
次年度の研究費の使用計画 |
開発したアセンブラの出力結果が正しいかを検証するために、fosmidクローンを作成シークエンスを実施する。そのための試薬代として主に使用する予定である。
|