2015 Fiscal Year Annual Research Report
Project/Area Number |
24510286
|
Research Institution | Kazusa DNA Research Institute |
Principal Investigator |
平川 英樹 公益財団法人かずさDNA研究所, 技術開発研究部, グループ長 (80372746)
|
Project Period (FY) |
2012-04-01 – 2016-03-31
|
Keywords | SNP解析 / バイオインフォマティクス / データベース |
Outline of Annual Research Achievements |
NCBIのdbESTおよびAB社製のSOLiDシークエンサーに対応させたSNP解析パイプラインをこれまでに構築したが、dbESTではゲノム全体におけるSNPの網羅性が低く、SOLiDではSRAデータベースにおける登録数が少ないという問題があったため、今年度はイルミナ社製HiSeqとMiSeqシークエンサーに対応させた。MiSeqで得られた長いリードの場合、Bowtie 2のend-to-endモードでマップすると疑陽性SNPが多い傾向が見られたため、localでマップするBWAを採用した。SNP検出手法として、SAMtoolsとVarScanの結果を比較したところ、大きな違いは見られなかったため、SAMtoolsのみを採用した。SRAデータベースに登録されているトマト2,152個のエントリーについて、XMLファイルから品種情報を自動的に抽出するスクリプトを作成したところ、1,026のエントリーから約500種の品種情報を得た。一方、表現型(形質)に関連するQTL情報とDNAマーカーは、SOL Genomics Networkから入手したが、その数は多くなかった。「機能情報をもつSNP」に必要なタンパク質立体構造の登録状況をPDBで確認したところ、植物で最もエントリーの数が多いものはシロイヌナズナの878個であり、トマトについては41個のみであった。このため、ホモロジーモデリングにより立体構造情報を構築した。今後は、表現型やQTL情報、立体構造に関する情報を充実させることが重要である。これにより表現型に関わる原因遺伝子が明らかにされ、優良形質の選抜や品種識別の効率が上がることで育種効率が向上することが期待される。
|