2012 Fiscal Year Research-status Report
Project/Area Number |
24510286
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Research Institution | Kazusa DNA Research Institute |
Principal Investigator |
平川 英樹 公益財団法人かずさDNA研究所, 植物ゲノム研究部, 主任研究員 (80372746)
|
Project Period (FY) |
2012-04-01 – 2015-03-31
|
Keywords | バイオインフォマティクス / SNP / 遺伝子機能 / タンパク質立体構造 / 機能部位 |
Research Abstract |
作物の形質に関連が深い遺伝子を特定するために「機能情報をもつSNP」を明らかにすることを目的とする。本研究では形質が比較的詳細に調べられているトマトを対象とした。本年度、NCBIのdbESTデータベースからEST配列を入手し、トマト55系統を含む707,445本を選出し各系統に分類した。その結果、分類されたEST配列の本数は、ゲノム配列解読の対象となったHeinz 1706(303,572本(43.2%)、食用)、Micro-tom(211,799本(29.9%)、矮性トマト)、TA496(108,463本(15.3%)、加工用)、E6203(17,693本(2.5%)、加工用)、Rio Grande(10,596本(1.5%)、食用)の順で多かった。次に、これらのEST配列に対してベクターとpoly-A(T)のトリミングを行った。トリミングされた55系統のEST配列をトマトゲノム配列SL2.40に対してマッピングすることで各系統におけるSNPを検出した。当初、マッピングにはMIRA3を用いたが、9系統以上になると計算が正常に終了しないという問題点が生じたため、GS reference mapperを用いることで18,021箇所のSNPを検出した。このうち29箇所はdbSNPに登録されていたが、残り18,021箇所は新規なものであった。さらに、各SNPを遺伝子との位置関係に基づき以下のカテゴリーに分類した(括弧内はSNP数)。mSNP(Nonsynonymous;2,008)、nSNP(Nonsense;41)、sSNP(Synonymous;2,150)、duSNP(3’ UTR;399)、ruSNP(5’ UTR;323)、ijSNP(エキソンの上下流2Kb以内;91)、gSNP(ゲノム領域;12,020)、iSNP(イントロン;1,017)。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
本年度は、NCBIからEST配列を入手し、ベクターとpoly-A(T)のトリミング、トマトの各系統への分類、ゲノム配列へのマッピング、SNPの抽出および分類を予定通りに行った。なお、計画書では、SNPのゲノム上の位置に基づき、cSNP(Nonsynonymous)、sSNP(Synonymous)、uSNP(1Kbp上流)、dSNP(1Kbp下流)、iSNP(イントロン)、gSNP(ゲノム)の6つのカテゴリーに分類する予定であったが、機能との詳細な関係を調べるために、mSNP、nSNP、sSNP、duSNP、ruSNP、ijSNP、gSNP、iSNPの8種類のカテゴリーに分類することにした。次年度は、これらのSNPが遺伝子の機能に及ぼす影響を調べ、「機能情報をもつ(機能と関連性が深い)SNP」を明らかにし、機能性マーカーとして利用できるかを調べる。この際、機能部位に存在するSNPは機能に直接的に影響を与えることが考えられるため、PDB(Protein Data Bank)にホモログの立体構造が登録されているトマト遺伝子については、アミノ酸配列から立体構造を構築し機能部位を推定することによりSNPの位置を調べる。現在、我々は、ビーズアレイにより得たトマト40系統について7,054箇所のSNPデータを所有しているため、SNPを上記の通りに分類し機能に及ぼす影響を調べた。その結果、200個の遺伝子については、SNPが機能部位に存在していたため、それらは機能性マーカーとして用いることができうると考えられ、さらに、これらの遺伝子は系統間の形質の違いに関連している可能性が考えられた。今回の解析では、アレイ解析により得られたSNPデータを用いたが、EST配列を用いて得られたSNPデータに対しても同様なSNPデータが得られるため、本解析手法が有効であると考えられた。
|
Strategy for Future Research Activity |
本研究では、NCBIにて公開されているEST配列を入手し、その後、トマトゲノム配列にマッピングすることで各系統におけるSNPを抽出する。今後は分類されたSNPをもつ遺伝子について機能との関連性を詳しく調べる。そのために、アミノ酸残基に置換が生じるNonsynonymous SNPについては、タンパク質のドメイン上に位置するか、さらには、立体構造上の機能部位に位置するかを調べる。一方、プロモータ配列上にSNPがある遺伝子については、転写活性に影響があることが推測される。このような機能に影響を及ぼしうるSNPをもつ遺伝子については、KOGやGO解析による機能分類、KEGGに対する代謝経路の解析などの解析を行うことで遺伝子機能との関連性を調べる。これら一連の解析により、機能に直接的に影響を及ぼすと推測されたSNPは「機能情報をもつSNP(機能性マーカー)」として利用することができうると考えられ、さらには、系統間の形質の違いに関連するものと考えることができる。
|
Expenditure Plans for the Next FY Research Funding |
本研究では、NCBIにて公開されている膨大な量のEST配列を入手し、さらには、ベクターやpoly-A(T)をトリミングする必要があるため、配列のデータ量はほぼ倍加する。また、EST配列のリファレンス配列に対するマッピング解析によるアライメント情報、EST配列に対するホモロジー解析やドメイン解析、さらには、ホモロジーモデリングにより得られた立体構造といったデータが産出されるため、さらにデータ量が増加することが予想される。一方、NCBIのSRA(Sequence Read Archive)データベースでは、次世代シークエンサにより解読された転写産物あるいはゲノムの配列が公開されている。今後、次世代シークエンサの配列も解析の対象として用いることを検討しているため、これらのデータも入手する予定である。そこで、次年度は、これらのデータを保存するために、主にネットワークストレージ(NAS)と学会および論文での発表に対して研究費を使用する。
|
Research Products
(1 results)