研究課題/領域番号 |
22700307
|
研究機関 | 東京大学 |
研究代表者 |
笠原 雅弘 東京大学, 大学院・新領域創成科学研究科, 講師 (60376605)
|
キーワード | アルゴリズム / ゲノム |
研究概要 |
昨年度に開発した、穴あきシードとソートを組み合わせた高速高精度なアラインメントのシーディングアルゴリズムの実装において、ソートステップにおける並列化手法を工夫し、総実行命令数は増えるもののCPUのキャッシュメモリへのヒット率を上げる計算手法を採り入れることによって更に高速で実用的なアラインメントアルゴリズムとして用いることができることを確認した。 また、大規模ゲノムアセンブリで染色体レベルの接続関係を保証するために遺伝学的地図を次世代シークエンサーで作成するためのアルゴリズムを去年度に引き続いて改良した。ヒメツリガネゴケのGransdenとVillersexelを掛け合わせた分離集団のゲノムDNAをショットガンシークエンシングした以前のデータを参照ゲノムへのアラインメント後に抽出したSNP情報から、アラインメントのアーティファクトによるものをインシリコで取り除くためのフィルターを条件検討し作成した。また、分離集団のアリルパターンをグラフィカルに表示するために、UTゲノムブラウザの拡張トラックを作成し、・UTゲノムブラウザの本家にマージした。各個体におけるジェノタイプ欠損値を周辺のジェノタイプからノイズを考慮しながら推定するアルゴリズムを開発した。また、このアルゴリズムによる推定結果をゲノムブラウザを用いて表示・検討したところ、既存のJGIによるヒメツリガネゴケアセンブリにはグローバルミスアセンブリが存在していることを見いだした。また、アセンブリへのコンタミ配列上には1:1に分離するSNPが検出されないために、アセンブリ中のコンタミ配列も発見することができるととを見いだした。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
当初の研究計画と比べると目標が達成されていないようにも見えるかもしれないが、当初の研究立案時には現在のような急速なハイスループットシークエンサーのスペック向上を予測することは難しく、立案時の予測と比較するとの処理するべきデータの量が大きく増えている。
|
今後の研究の推進方策 |
遺伝多型とゲノムアセンブリを組み合わせるアルゴリズムについては、今後ジ土ノタイピング精度の改善とFO個体がinbredでない場合への拡張などが実用上は必要になってくるためにこれを開発していく。また、ユーザーインタフェースの開発が必要であり、既に着手しているUTGBへの拡張を更に推し進めていく。
|