研究課題/領域番号 |
24500366
|
研究機関 | 国立遺伝学研究所 |
研究代表者 |
神沼 英里 国立遺伝学研究所, 生命情報研究センター, 助教 (90314559)
|
キーワード | SNP / 次世代シークエンサ / Sequence Read Archive / データベース / ゲノム多様性 |
研究概要 |
本研究の目的は、植物系統の一塩基多型(Single Nucleotide Polymorphism:SNP)を新型シークエンサのアーカイブ配列データベース(DDBJ Sequence Read Archive:DRA)を用いて、統一基準で統合解析し、ゲノム多様性研究の知識基盤を提供する。 2年目の平成25年度は、解析パラメータの検討と多様性統計指標解析のテストを目標とした。解析パラメータの検討では、SNP計算の為のゲノム被覆率と深度の関係を調べた。DRA公開データとして、DRA000307のイネ系統の全ゲノムシークエンシングデータを用いた。日本晴ゲノムIRGSP build05参照配列に対してDRA000307配列をアライメントして、シークエンシング・データ量に依存する深度と参照配列被覆率を計算した。またRice Annotation Project(RAP)の34,792遺伝子について遺伝子数被覆率も計算した。結果として、参照配列被覆率と遺伝子数被覆率も、共に深度15~20程でほぼ一定状態になった。これにより、配列アーカイブの解析条件として、深度15以上のデータを用いる事とした。一方、多様性統計指標解析については、テスト的に柑橘11品種全ゲノム配列実験データについて、アリル頻度解析と連鎖不平衡解析を行った。しかしDRA公開データでの解析や、ワークフロー用のプログラム組込まで到達しなかった為、平成26年度にこれらを検討していく。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
本研究の目的は、新型シークエンサのアーカイブ配列データベースDRAを用いて、統一基準で複数パネル分のSNPの再解析を行い、ゲノム多様性研究の知識基盤となる統合SNPパネルを提供することである。2年度目の達成目標は、統合SNPの精度評価と多様性指標解析である。多様性指標の統計解析プログラムと、SNPデータ公開先のDNAPodデータベースとを連携する開発を行う予定であった。しかし解析プログラム構築に時間がかかり、DNAPodデータベースと連携する部分の開発を行う事が出来なかった。平成26年度に本開発を行う。
|
今後の研究の推進方策 |
平成26年度に平成25年度の残り作業である多様性解析プログラムとDNApodデータベースとの連携開発を行う。平成26年構築予定の解析ワークフローは、平行して作成していく。
|
次年度の研究費の使用計画 |
多様性解析の解析が遅れた為に、プログラム開発を次年度に移行した。この為、開発費として638,344円を次年度に使用することとした。 プログラム開発費に用いる。
|