研究課題/領域番号 |
24310142
|
研究機関 | 東京工業大学 |
研究代表者 |
伊藤 武彦 東京工業大学, 生命理工学研究科, 教授 (90501106)
|
研究分担者 |
丸山 治彦 宮崎大学, 医学部, 教授 (90229625)
野口 英樹 国立遺伝学研究所, 先端ゲノミクス推進センター, 特任准教授 (50333349)
|
研究期間 (年度) |
2012-04-01 – 2015-03-31
|
キーワード | ゲノム情報 / アセンブラ / 遺伝子予測 |
研究概要 |
近年のシークエンス技術の進歩により、次世代シークエンサを用いた新規ゲノム解読が比較的容易に試みられるようになってきている。しかし成功を収めているのは、従来からのモデル生物や近交系が確立した生物に限定され、野生種など多くの生物のゲノム解読は、ヘテロ接合性の高さに起因しアセンブルがうまく行かず、行き詰まっているのが現状である。そこで、本研究ではヘテロ接合性の高いゲノムに適応したshort-read向けアセンブラ/および遺伝子予測パイプラインを開発することを第一の目的としている。 本年度は、昨年度までに開発したde bruijnグラフアルゴリズムを用いたshort-read向け新規denovoアセンブラに対して改良を加え、よりよい統計結果と少ないミスアセンブルが得られるように改良を施した。今までは線虫をモデル生物として用い、線虫を実際にIllumina Hiseqでシークエンスしたデータに計算機上でヘテロサイトを導入してベンチマークを実施していた。今年度は実際の高ヘテロ接合性ゲノムであるベネズエラ糞線虫のゲノムを宮崎大学にて抽出、シークエンスしさらに「正解」データとしてベネズエラ糞線虫ゲノムFosmidクローンのシークエンスも実施し、これらをもとにベンチマークテストを繰り返し実施した。作成を実施した。 一方遺伝子予測パイプラインの構築に関しては、上記開発したアルゴリズム(グラフ構造中に多分岐を許す)をRNA-seqに適用する事でのRNA-seqアセンブラの開発に着手した。これによりAlternative Spliceで生じる分岐への対応が可能になることが期待される。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
高ヘテロ接合性ゲノム向けアセンブラの開発は順調に進んでおり、ベンチマークにて他のツールよりも良い統計量を示していること、さらには遺伝子予測ツールに関してもプロトタイプ開発が終了していることなどから順調に推移していると考えられる。
|
今後の研究の推進方策 |
最終年度となる次年度では、今年度までに開発した高ヘテロ接合性ゲノム向けアセンブラをまとめ公開するとともに論文化を計る。また、本アルゴリズムを応用したRNA-seq用アセンブラも同様に公開と論文化を計り、さらにこのツールを遺伝子予測パイプラインの一部として組み込む事で、精度の高い遺伝子予測を実現する。
|
次年度の研究費の使用計画 |
開発したゲノムアセンブラのベンチマーク用にシークエンスを行っているが、そのサンプルの準備に予定より 時間を要したため、次年度に繰り越す事になった。また、同様の理由でそのデータ解析をするサーバの導入も次年度に先送りしたため。 上記理由による繰り越し事案を実現するため、Miseqを用いたシークエンス費用および年度始めに解析サーバの導入を予定している。
|