2014 Fiscal Year Research-status Report
Project/Area Number |
24510286
|
Research Institution | Kazusa DNA Research Institute |
Principal Investigator |
平川 英樹 公益財団法人かずさDNA研究所, 技術開発研究部, グループ長 (80372746)
|
Project Period (FY) |
2012-04-01 – 2016-03-31
|
Keywords | SNP解析 / バイオインフォマティクス / データベース |
Outline of Annual Research Achievements |
本研究ではトマトを対象として品種間のSNPを検出し、それらが遺伝子機能に与える影響を調べ表現型との関連性を明らかにすることを目的とする。そこで、NCBIのdbESTデータベースから入手したトマト37品種のEST配列をトマトゲノム配列に対してマッピングすることでSNPを検出し、その位置に基づき遺伝子機能に及ぼす影響を調べる解析手法を確立した。表現型としては、病害抵抗性やストレス耐性、着色、矮性、果実の色・硬さ・重み、芳香成分といった既報のものを対象とした。その結果、EST配列では本数が少ないため十分な精度が得られないこと、ゲノムワイドなSNPが得られないこと、品種によってEST配列の本数が異なるため全ての品種における特定の箇所の塩基置換を比較することができないことが問題点として挙げられた。本年度はゲノムワイドなSNPを得るためにNCBIのSRAデータベースで公開されている新型シークエンサーのデータを用いることにした。AB社製SOLiD のゲノム由来の配列データに対するマッピングにはLifeScope、SNP検出にはVarScan、SNPアノテーションにはSnpEffを用いた解析パイプラインを構築した。SOLiDにより得られたトマト6品種のゲノム由来の配列データに対して解析した結果、リードのマップ率は75.0~77.9%、リファレンス上のカバー率は92.7~93.4%であったが、リードの厚みが8.5~17.3となり精度上、十分な量では無かった。しかしながら78のうち72の原因遺伝子において品種間のSNPが検出され、そのうち32については非同義置換であった。さらに、イルミナ社製HiSeqにより得られた配列データに対応した解析パイプラインを構築した。これにより多品種間におけるゲノムワイドなSNPを調べることができるため、今後、原因遺伝子との対応関係が明らかになることが期待される。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
初年度はEST配列をマッピングすることで検出されたSNPの位置に基づき、非同義置換、同義置換、ナンセンス置換、3’と5’UTRにおける置換、遺伝子の上下流2 kb以内における置換、ゲノム領域における置換、イントロンにおける置換の9通りに分類するプログラムを自作した。その後に公表されたSNPを分類するプログラムを適用することで解析手法を確立した。しかしながら、NCBIで公開されているEST配列の本数が少ないためゲノムワイドなSNPが検出されず、品種間でSNPを比較することが困難であった。本年度はゲノムワイドなSNPを検出するため、NCBIのSRAデータベースで公開されている新型シークエンサーによるデータに対応した解析パイプラインを構築した。一方、トマトのゲノム配列がSL2.50に更新されたため、全遺伝子に対する機能推定やKOGによる機能分類、KEGGによる代謝経路の推定、活性部位の予測といった一連の解析を再度実施した。これにより、病害抵抗性やストレス耐性、着色、矮性、果実の色・硬さ・重み、芳香成分といった表現型に関連する70 以上の原因遺伝子における品種間のSNPを調べることで表現型に関連する「機能情報をもつ(機能と関連性が深い)SNP」を推定した。新型シークエンサーによる配列データを用いてゲノムワイドなSNPを検出する手法を検討するために時間を要したため、本年度は解析パイプラインの構築とAB社製SOLiDのゲノム由来のデータを用いた解析までしか行えず、イルミナ社製HiSeqの配列データを用いた解析まで実施することができなかった。この点が達成されていないため、予定よりも研究計画の実行が遅れている状況である。
|
Strategy for Future Research Activity |
これまでにEST配列を用いることでトマト37品種を対象にしてSNPを検出したが、ゲノムワイドなSNPを検出することができなかった。本年度は新型シークエンサーによる配列データを用いたゲノムワイドなSNPの検出法を確立するため、マッピングプログラムやSNP検出方法、SNPの分類法を検討し解析パイプラインを構築した。これによりAB社製SOLiDとイルミナ社製HiSeqに対応することができるようになった。現在、NCBIのSRAデータベースには様々なトマト品種について1,500を超える新型シークエンサー由来のゲノムやRNA-Seqデータが公開されている。事業の補助期間を延長することができたため、次年度はイルミナ社製HiSeqによるゲノムおよびRNA-Seq由来の配列データを対象とした解析を行うことでゲノム間やイントロンにおけるSNPを検出し、これまでに得られたSOLiDのゲノム由来の配列データとEST配列を用いた解析による結果を合わせることで、より多くの品種を対象としたゲノムワイドなSNPを検出する。病害抵抗性やストレス耐性などの原因遺伝子についての調査は論文やウェブサイトを通じて引き続き行う。こうして得られた品種間のSNPと表現型との対応関係を調べることで「機能情報をもつ(機能と関連性が深い)SNP」を推定する。
|
Causes of Carryover |
本年度は本研究計画の遂行に欠かせない新型シークエンサーを用いたゲノムワイドなSNPを検出する手法を検討することに時間を要したため、AB社製SOLiDの実データを用いた解析を始める時期が遅くなってしまった。本年度で新型シークエンサーに対応した解析パイプラインを構築することができたため、次年度はイルミナ社製HiSeqのゲノムおよびRNA-Seq由来の配列データを対象とした解析を行い、SOLiDのゲノム由来のデータとEST配列を用いて解析した結果と合わせることで、より多くの品種を対象としたゲノムワイドなSNPを検出する。
|
Expenditure Plan for Carryover Budget |
本年度で解析手法を確立することができたため、次年度はEST配列と新型シークエンサーのデータを用いてより多くの品種を対象としたゲノムワイドなSNPを検出し、品種間のSNPと表現型との対応関係を調べることで「機能情報をもつ(機能と関連性が深い)SNP」を推定する。新型シークエンサーのゲノムやRNA-Seq由来のデータを用いることで膨大な量の配列データを取扱い、さらには、大量のSNPジェノタイプデータが得られるため、それらを保存するためのストレージと統計解析を行うためのプログラムを購入する。
|
Research Products
(1 results)