2011 Fiscal Year Annual Research Report
次世代DNAシークエンサーを用いたゲノム解読のためのアルゴリズム開発
Project/Area Number |
22700307
|
Research Institution | The University of Tokyo |
Principal Investigator |
笠原 雅弘 東京大学, 大学院・新領域創成科学研究科, 講師 (60376605)
|
Keywords | アルゴリズム / ゲノム |
Research Abstract |
昨年度に開発した、穴あきシードとソートを組み合わせた高速高精度なアラインメントのシーディングアルゴリズムの実装において、ソートステップにおける並列化手法を工夫し、総実行命令数は増えるもののCPUのキャッシュメモリへのヒット率を上げる計算手法を採り入れることによって更に高速で実用的なアラインメントアルゴリズムとして用いることができることを確認した。 また、大規模ゲノムアセンブリで染色体レベルの接続関係を保証するために遺伝学的地図を次世代シークエンサーで作成するためのアルゴリズムを去年度に引き続いて改良した。ヒメツリガネゴケのGransdenとVillersexelを掛け合わせた分離集団のゲノムDNAをショットガンシークエンシングした以前のデータを参照ゲノムへのアラインメント後に抽出したSNP情報から、アラインメントのアーティファクトによるものをインシリコで取り除くためのフィルターを条件検討し作成した。また、分離集団のアリルパターンをグラフィカルに表示するために、UTゲノムブラウザの拡張トラックを作成し、・UTゲノムブラウザの本家にマージした。各個体におけるジェノタイプ欠損値を周辺のジェノタイプからノイズを考慮しながら推定するアルゴリズムを開発した。また、このアルゴリズムによる推定結果をゲノムブラウザを用いて表示・検討したところ、既存のJGIによるヒメツリガネゴケアセンブリにはグローバルミスアセンブリが存在していることを見いだした。また、アセンブリへのコンタミ配列上には1:1に分離するSNPが検出されないために、アセンブリ中のコンタミ配列も発見することができるととを見いだした。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初の研究計画と比べると目標が達成されていないようにも見えるかもしれないが、当初の研究立案時には現在のような急速なハイスループットシークエンサーのスペック向上を予測することは難しく、立案時の予測と比較するとの処理するべきデータの量が大きく増えている。
|
Strategy for Future Research Activity |
遺伝多型とゲノムアセンブリを組み合わせるアルゴリズムについては、今後ジ土ノタイピング精度の改善とFO個体がinbredでない場合への拡張などが実用上は必要になってくるためにこれを開発していく。また、ユーザーインタフェースの開発が必要であり、既に着手しているUTGBへの拡張を更に推し進めていく。
|
Research Products
(1 results)