2014 Fiscal Year Annual Research Report
新型シーケンサ・アーカイブ配列を用いた植物系統SNP統合と多様性指標解析
Project/Area Number |
24500366
|
Research Institution | National Institute of Genetics |
Principal Investigator |
神沼 英里 国立遺伝学研究所, 生命情報研究センター, 助教 (90314559)
|
Project Period (FY) |
2012-04-01 – 2015-03-31
|
Keywords | DNA多型 / 次世代シークエンサ / SNP / 遺伝的多様性 / データベース |
Outline of Annual Research Achievements |
本研究では、植物系統の一塩基多型(Single Nucleotide Polymorphism:SNP)を新型シークエンサのアーカイブ配列データベース(DDBJ Sequence Read Archive:DRA)を用いて、統一基準で統合解析し、ゲノム多様性研究の知識基盤を提供する。統合SNPデータは、形質マッピング等の遺伝育種研究や集団多様性研究の基盤資源になる。形質マッピングの遺伝マーカとして統合SNPデータを利用する事が可能になり、集団毎に多様性指標解析も行うことが出来る。 最終平成26年度の成果として、遺伝子領域SNP注釈ワークフローの構築を行った。具体的には、NGS配列注釈ツール「DDBJ Pipeline(http://p.ddbj.nig.ac.jp/)」の高次処理部に、遺伝子領域SNP注釈ワークフローを1機能として実装した。ワークフローではSnpEffツール(Cingolani P, Fly, 6:80, 2012)により、遺伝子の構造領域情報を基に、対象SNPの効果注釈(非同義置換等)を行う。一方、DNAPodデータベース(http://tga.nig.ac.jp/dnapod/)には、DRA登録WGSデータ由来の、イネ679系統・ソルガム66系統・トウモロコシ404系統の3植物属全1,149系統の多型データが登録されている。1,149系統の多型データのうちホモ接合SNPについて効果注釈を行い、注釈結果をDNAPodサイトからダウンロード可能にした。また多様性統計指標は、最終的にヘテロ接合度期待値(Expected Heterozygosity : He)、アリル頻度(Allele Frequency), 多型情報量(Polymorphism Information Content: PIC)の計算プログラムを構築した。
|
Research Products
(4 results)
-
[Presentation] DNA Polymorphism Database from New-Generation Sequence Read Archive and Analytical Workflow2015
Author(s)
Mochizuki T, Tanizawa Y, Fujisawa T, Nikoh N, Toyoda A, Fujiyama A, Kurata N, Nagasaki H, Shimizu T, Kaminuma E, Nakamura Y
Organizer
Plant & Animal Genome XXIII
Place of Presentation
San Diego (USA)
Year and Date
2015-01-14 – 2015-01-14
-
-
-