2017 Fiscal Year Research-status Report
Construction of transcription related database of C4 grass plant, Sorghum bicolor and its application
Project/Area Number |
17K07265
|
Research Institution | Institute of Physical and Chemical Research |
Principal Investigator |
蒔田 由布子 国立研究開発法人理化学研究所, 環境資源科学研究センター, 研究員 (80443026)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | RNA-seq / Sorghum bicolor BTx623 / Sorghum bicolor Keller / グレインソルガム / スィートソルガム / MOROKOSHI database / transcriptome |
Outline of Annual Research Achievements |
ソルガムは世界五大穀物の一つであり、環境ストレスにも強いため、バイオマス生産植物として注目されている。既にゲノム配列は公開されているが、それ以外のリソースに著しく不足している。そこで高糖性・高バイオマス研究への応用や、環境ストレス耐性メカニズムの解明のためのリソース整備として、ソルガムのトランスクリプトーム情報基盤の整備・公開を進めている。 H29年度は、糖蓄積器官の異なる2系統の発現比較をすることで、mRNA-seqによりH29年度は、①完全長cDNA情報の取得、②スィートソルガム(Keller)のRNA-Seq(穂, 種子, 茎)データの取得とそのデータ解析を計画し、予定通り遂行した。 ①完全長cDNAにおいては、Iso-seq (isoform sequencing)により同定された約11,000遺伝子と新たに発現が確認しされた約2100遺伝子に相当するデータ(Nat Communications. Abdel-Ghany SE, et al. 2016)を我々のデータベースへ統合させ、既に公開しているサンガーシーケンスによる完全長cDNAデータと比較し閲覧できるようにした。PacBio社のlong readの特性を活かしたIso-seqのデータとを取り入れることで、より正確な遺伝子の構造情報(スプライシングバリアント)が得られ、RNA-seq解析においても基礎となるデータを構築した。 次に②糖代謝に関する遺伝子の発現懐石を行なうため、スィートソルガム(Keller)のRNA-seqデータを、既に論文としてまとめたグレンインソルガム(BTx623)と同じサンプル条件にて、発現部位ごとに(穂、種子、茎)データを取得した。この結果、糖を輸送するたんぱく質の発現が茎に糖を貯めるKellerとそうではないBTx623では異なることが示された。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
H29年度は、①完全長cDNA情報の取得、②スィートソルガム(Keller)のRNA-Seq(穂, 種子, 茎)データの取得とそのデータ解析を計画し、予定通り遂行した。
|
Strategy for Future Research Activity |
平成30年度においては、グレインソルガム(BTx623)とスィートソルガム(Keller)のCAGEデータ(穂, 種子, 茎)の取得と解析を行う。 完全長cDNAで取得された転写開始点データと既存の遺伝子予測による転写開始点を比較したところ、99%が公開データと重ならないという驚くべき結果となった。もちろん我々の完全長cDNAでは捕えることのできなかった転写開始点もあるだろうが、既存のアノテーションにある転写開始点データの9割が完全長cDNAよりも上流側にアノテートされていることから、多量のEST配列を用いたことで、最も頻度の高い転写開始点ではなく、最も長く存在したプロモータ配列でアノテーションが付けれられてしまっている。そこで、本研究では、CAGE法で得られるソルガムの転写開始点データ用い、頻度の高い実際の転写開始点を決定することで、構造遺伝子の修正も行う。 平成31年度は、gDB-Seq法を用いて糖・デンプン合成を制御する転写因子の被制御遺伝子群の解明と転写因子結合モチール配列の解析を行なう。gDB-Seq法とは、in vitroで転写因子が物理的に結合できるゲノム上の部位を同定するハイスループットな手法である。具体的には、転写因子を無細胞系タンパク質合成装置で合成させておく。また転写因子には、免疫沈降により選別できるようにHAエピトープタグを付与しておく。一方で、ソルガムのgenomic DNA(gDNA)を断片化させておき、合成した転写因子に結合させる。転写因子が結合した配列のみを次世代シーケンサーで読むことで、被制御遺伝子と結合モチーフを予測することができる。gDB-SeqデータとCAGE, RNA-Seqを合わせることで、糖・デンプン合成に関する転写ネットワークを解明し、系統間の比較から糖を蓄積するために重要な遺伝子を絞り込む。
|
Causes of Carryover |
スィートソルガムは種子からタンニンを出すため、RNAの精製が困難な植物である。そのため、タンニンが悪影響をした場合のことも考慮した予算案となっていた。しかし2017年度のmRNA-seqでは、やり直しの必要が生じなかったため、差額が生じた。 2018年度においても同様にRNAを精製するため、シーケンスのやり直しが生じた場合にはには、そこに利用する。問題なくプロジェクトが進んだ場合は、次世代シーケンスのデータ量を増やすことに利用し、研究を充実させる。
|
Research Products
(4 results)