研究課題/領域番号 |
24500366
|
研究種目 |
基盤研究(C)
|
研究機関 | 国立遺伝学研究所 |
研究代表者 |
神沼 英里 国立遺伝学研究所, 生命情報研究センター, 助教 (90314559)
|
研究期間 (年度) |
2012-04-01 – 2015-03-31
|
キーワード | DNA多型 / SNP / 遺伝的多様性 / データベース |
研究概要 |
本研究では、植物系統の一塩基多型(Single Nucleotide Polymorphism:SNP)を新型シークエンサのアーカイブ配列データベース(DDBJ Sequence Read Archive:DRA)を用いて、統一基準で統合解析し、ゲノム多様性研究の知識基盤を提供する。統合SNPデータは、形質マッピング等の遺伝育種研究や集団多様性研究の基盤資源になる。形質マッピングの遺伝マーカとして統合SNPデータを利用する事が可能になり、集団毎に多様性指標解析も行うことが出来る。 初年平成24年度の成果として、DRA公開済の植物登録系統で統合SNPパネルを構築した。ゲノムが公開されておりDRA登録数が多い植物種としてイネを選択した。Whole Genome Shotgun研究のDRA植物エントリから678のイネ系統を抽出して、SNP解析を行い統合した。このイネ678系統の多型データは、DNAPodデータベース(http://tga.nig.ac.jp/dnapod/)で公開している。データ構築方法は、DRAのゲノム研究データから系統単位でFASTQ形式の生配列を抽出して、参照ゲノム配列Oryza sativa 日本晴系統(IRGSP build05)へのアライメントを行い、samtoolsでSNP検出を行った。SNP数が多かったOryza nivara IRGC 105327系統(SRS086324, SNP数:N=3.5x10^6)から、最小数の日本晴系統(ERS006293,N=1.5x10^3)まで同一解析基準でSNPを構築した。678系統のうち、621系統は深度5x以下の薄読データである。今後は多様性指標解析を行い、SNP注釈付プログラムを実装していく。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
植物分野では、次世代シークエンサ由来の系統コレクション高密度SNPパネルが続々と発表されており、タグSNP解析等で絞り込まれた後で、遺伝子型タイピング実験用にSNPアレイにまとめられたりしている。これら高密度SNPパネルは実験研究単位の系統でまとまっており、追加系統分の新規SNPは統合するしかないが、解析基準がばらばらで統合処理は一般に困難である。そこで解析対象となる全系統の新型シークエンサのアーカイブ配列を使って、高密度でSNPを再解析し直して、全系統コレクションの統合SNPパネルを構築する方法を提案する。本研究の目的は、新型シークエンサのアーカイブ配列データベースDRAを用いて、統一基準で複数パネル分のSNPの再解析を行い、ゲノム多様性研究の知識基盤となる統合SNPパネルを提供する事である。年度毎の到達目標は、1年度目標: DRA公開済の植物系統でSNP統合解析を確立、2年度目標: 統合SNPの精度評価と多様性指標解析、3年度目標: 統合SNP注釈ワークフローの構築である。1年度目のDRA公開済植物登録系統を使った統合SNPセットの構築は、予定通りデータを構築してインターネット上に公開する事が出来た(http://tga.nig.ac.jp/dnapod/)。ただし、当初はイネとトウモロコシの両方を対象に想定していたが、イネに限り系統数を増やして公開したので、一種のみの限定的なデータとなっている。今後、複数の植物種について拡張していく予定である。
|
今後の研究の推進方策 |
複数の植物系統のSNPパネルを統合する為に、新型シーケンサ・アーカイブ配列を利用する。研究方法として、初年度はDRA公開済の植物登録系統で統合SNPパネルを構築した。今後、平成25年度(2年度目)は、公開検証データを利用して構築した統合SNPの精度評価を行なう。また統合SNPの多様性統計指標としてアリル頻度を求めるプログラムを構築する。最終年度は、遺伝子領域に限ったSNP注釈ワークフローの構築を行い、多様性研究者やゲノム育種研究者の為の解析基盤を提供する。
|
次年度の研究費の使用計画 |
該当なし
|