研究実績の概要 |
本研究では、植物系統の一塩基多型(Single Nucleotide Polymorphism:SNP)を新型シークエンサのアーカイブ配列データベース(DDBJ Sequence Read Archive:DRA)を用いて、統一基準で統合解析し、ゲノム多様性研究の知識基盤を提供する。統合SNPデータは、形質マッピング等の遺伝育種研究や集団多様性研究の基盤資源になる。形質マッピングの遺伝マーカとして統合SNPデータを利用する事が可能になり、集団毎に多様性指標解析も行うことが出来る。 最終平成26年度の成果として、遺伝子領域SNP注釈ワークフローの構築を行った。具体的には、NGS配列注釈ツール「DDBJ Pipeline(http://p.ddbj.nig.ac.jp/)」の高次処理部に、遺伝子領域SNP注釈ワークフローを1機能として実装した。ワークフローではSnpEffツール(Cingolani P, Fly, 6:80, 2012)により、遺伝子の構造領域情報を基に、対象SNPの効果注釈(非同義置換等)を行う。一方、DNAPodデータベース(http://tga.nig.ac.jp/dnapod/)には、DRA登録WGSデータ由来の、イネ679系統・ソルガム66系統・トウモロコシ404系統の3植物属全1,149系統の多型データが登録されている。1,149系統の多型データのうちホモ接合SNPについて効果注釈を行い、注釈結果をDNAPodサイトからダウンロード可能にした。また多様性統計指標は、最終的にヘテロ接合度期待値(Expected Heterozygosity : He)、アリル頻度(Allele Frequency), 多型情報量(Polymorphism Information Content: PIC)の計算プログラムを構築した。
|