2018 Fiscal Year Annual Research Report
Epigenetics analysis for determination of floral patterns in each cell
Project/Area Number |
17H03769
|
Research Institution | Kazusa DNA Research Institute |
Principal Investigator |
平川 英樹 公益財団法人かずさDNA研究所, ゲノム情報解析施設, 施設長 (80372746)
|
Co-Investigator(Kenkyū-buntansha) |
細川 宗孝 近畿大学, 農学部, 教授 (40301246)
白澤 健太 公益財団法人かずさDNA研究所, 先端研究開発部, 主任研究員 (60527026)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | 花の模様形成 / エピジェネティックス / ゲノム解読 / RNA-Seq解析 / small RNA / データベース |
Outline of Annual Research Achievements |
前年度にPacific Biosciences社製Sequelにより得られた12セル分のセントポーリアの半数体のロングリードに対して、FALCON/FALCON-Unzipによるde novoアセンブルを行い、その後、Arrowにより補正することで、3,221本のprimaryコンティグ(総延長:704.2 Mb、N50長:1.3 Mb)と1,508本のassociateコンティグ(総延長:121.0 Mb、N50長:131.1 kb)を構築した。primaryコンティグとassociateコンティグを合わせ、500 bp以上の配列を採用することで、4,692本から構成されるゲノム配列SIO_r1.0(総延長:825.3 Mb、N50長:958.3 kb)を得た。これまでに取得したRNA-Seqデータについて、SIO_r1.0に対するマップ率を調べた結果、品種キラウェアでは86.9~91.9%、チコでは82.8~83.4%となった。一方、small RNAのマップ率は、キラウェアで78.6~79.2%、チコで72.7~76.4%となった。イルミナ社製HiSeqにより半数体のゲノムシークエンスを行った結果、ゲノムサイズは768.3 Mbと推定された。この結果からprimaryコンティグのみを採用し、最終的に3,184本のドラフト配列SIO_r1.0_p(総延長:704.4 Mb、N50長:1.25 Mb)を得た。BUSCO解析によるComplete%は96.1%となり、ドラフトゲノム配列の遺伝子の網羅性は高いと考えられた。Canuも用いてde novoアセンブルを行った結果、6,548本のコンティグが形成され、その総延長は911.5 Mb、N50長は487.6 kbとなり、FALCON/FALCON-Unzipよりも長く繋がらなかった。このため、SIO_r1.0_pをドラフトゲノム配列として決定した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
ゲノムワイドな発現解析とエピジェネティクス解析を行うために、まずは、ゲノム情報基盤として、Pacific Biosciences社製Sequelを用いてセントポーリアのゲノム由来のロングリードをシークエンスし、de novoアセンブルすることでドラフトゲノム配列を構築した。イルミナ社製HiSeqによりショートリードを取得しゲノムサイズを推定した。また、BUSCOにより遺伝子の網羅性を調べた。これらの結果から構築したドラフトゲノム配列の精度は十分に高いと考えられた。ゲノム配列の解読に関しては順調に進んでいる。遺伝子予測については、当初de novoで実施したが、精度が十分でなかった。そこで、遺伝子予測の精度を上げるために、葉や花糸、茎頂、カルスなど5つの組織から19個体についてサンプリングを行い、RNA-SeqとIso-Seqのデータを得た。来年度は、RNA-SeqとIso-Seqデータを用いて遺伝子予測を行う。キラウェアとチコの2品種についての発現解析については、遺伝子予測が完了していないため、それぞれの品種からシークエンスされたRNA-Seqをde novoアセンブルすることでunigeneを構築し、そのunigeneに対してそれぞれの品種のRNA-Seqリードをマッピングすることでunigeneの発現量を推測した。各unigeneについて、キラウェアとチコ間での発現量の違い調べたところ、花色模様に関連がありそうなunigeneを見出すことができなかった。今年度に予定していたBisulfiteシークエンシング(BS-Seq)を実施することができなかったが、それ以外は予定通りに進んでいる。BS-Seqは次年度に実施する。
|
Strategy for Future Research Activity |
5つの組織から19個体についてのRNA-Seqデータを用いて遺伝子予測を行う。さらに、Iso-Seqデータを用いて遺伝子構造を調べ高精度な遺伝子予測を目指す。ゲノム解読の結果はデータベースで公開する。縞模様が異なる各変異系統における花弁部位別全ゲノムDNAメチル化状態およびRNA転写発現の解析に関しては、キラウェア1個体の不定芽由来の複数の植物から親と同じ縞模様が出現した個体、縞が逆転した個体、まだら模様の個体、L1層あるいはL2層の表現型となった単色個体をそれぞれ3個体ずつ選抜し、L1層と同一の単色個体と L2層と同一の単色個体の2つの花弁についてのBS-Seqデータを取得する。親個体あるいは各変異個体の花弁においてL1層あるいはL2層の花色の部位を切り分けメチル化状態を調べ、これまでに得たRNA-Seqによる発現解析の結果と比較する。茎頂分裂組織と花弁のメチル化状態およびRNA-Seq解析については、同一個体の経時的なメチル化解析を実施し、茎頂分裂組織あるいは分化・発達においてDNAメチル化が生じる時期を調べる。マイクロダイセクション法で茎頂分裂組織と花弁組織を収集し、BS-SeqとRNA-Seqによりメチル化状態およびRNAの転写発現を定量化する。取得したRNA-Seqデータを用いて共発現解析を行い、メチル化状態および転写発現のネットワーク解析を行う。全遺伝子をKEGG代謝経路上にマップし分子間相互作用経路を同定する。表現型に特異的なネットワークを形成する遺伝子が集中する経路を同定し、表現型の発現に重要な役割を担う代謝、シグナル伝達、遺伝情報などを明らかにする。全エピゲノムと表現型とのアソシエーション解析(EWAS)およびRNA転写発現の定量データと表現型とのアソシエーション解析(TWAS)を実施し、表現型に重要な役割を担う全エピゲノムおよび転写発現を明らかにする。
|