研究課題/領域番号 |
16K14641
|
研究機関 | 東京工業大学 |
研究代表者 |
伊藤 武彦 東京工業大学, 生命理工学院, 教授 (90501106)
|
研究期間 (年度) |
2016-04-01 – 2018-03-31
|
キーワード | RNA-seq / 遺伝子予測 |
研究実績の概要 |
本研究課題は、真核生物新規ゲノム配列が決定された後などに必要となる遺伝子配列の同定を、新規RNA-seq実験手法の開発とデータの解析手法の双方から目指すものである。本年度実施した研究実績の概要は以下の通りである。 ①実験手法開発における予備実験として、DNAを制限酵素で切断したフラグメントに対し3'末端を修飾保護後、5'側からExo3を用いた消化反応を行い、一定時間ごとにサンプルを採取することで少しずつ5'側が削られた様々な長さのDNA断片を回収することに成功した。また、その両端をIlluminaにて読むことを試みたが、1000bp以上のフラグメントではpair-endライブラリではうまくなかったため、mate-pairライブラリ作成手法を試みることでこの問題は回避することに成功した。 ②上記①で得られたデータをoverlap-layout-concensusアルゴリズムを用いてアセンブルするための手法を開発し、①で得られたデータに対して適用することで1フラグメントあたり数本のcontigにまでアセンブルすることに成功した。 ③上記②で得られたcontigを入力とし、ゲノムをガイドとして利用するアセンブラの開発を実施した。具体的には、以前に開発したplatanusアセンブラに分岐構造をもたせることを可能とするような改良を加えることで、イントロン部分をバブル構造としてスキップするパスも選択できるようにし、結果としてエクソンーイントロン構造を満足する遺伝子予測結果が出力できるようになった。またこの際に、ゲノムを構成しているk-merのみをRNA-seqデータから利用することで、エラーと発現頻度の低いk-merとを区別することが困難であるという問題をクリアすることに成功した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
当初の申請書記載内容に沿った進捗はできていると考えられる。しかしながら、Exo3を用いた同一DNAフラグメント由来の様々な断片のIlluminaシークエンスにおいて、pair-end法のみではうまくライブラリができないこと、またmate-pair法を用いることで対処する場合でも、長いものほど非効率にライブラリができてしまうため、一度のライブラリ調整で実験が終了しないことなどの問題点も明らかになってきた。 以上を踏まえると、このままRNAの実サンプルへの適用は困難と考えられるため、申請書に記載した方法からさらなる改良を加える必要が出てきたため、進捗区分としてはやや遅れているとした。
|
今後の研究の推進方策 |
現在までの進捗状況で記載したような問題点が露見したため、もともとの提案では想定していなかったlong readタイプのデータの活用も検討する予定である。PacBioでは初期テンプレート量を相当量必要とするため発現量の極めて高いものしかデータを得ることができず、網羅的な遺伝子解析のためにはあまり効果的ではないと考えられる。しかし1-2年ほど前より実用化が進められているNanoporeシークエンサでは、テンプレート量がそこまで大量には必要ではないと言われている。 このため、来年度はNanoporeでのRNA-seqも視野に入れ、Illuminaデータとの併用により当初の研究目標が達成できるように進める予定である。具体的には、Nanoporeデータの場合、シークエンスエラーの高さが問題となることが想定されるため、Nanoporeデータを、ゲノム情報およびIllumina配列情報の双方を利用することで修正し、精度の高いRNA配列を取得することで当初予定していたIlluminaによるRNAcontigと置き換え、その後の解析に利用する予定である。 また、coverageのバラ付きなどに起因し、読めない箇所があることも想定されるため、その箇所に関しては当初の予定通りAb initio遺伝子予測手法との組み合わせでデータ欠損部分の補完を行う。 これらの手法の組み合わせにより、当初目標の達成を目指す。
|
次年度使用額が生じた理由 |
本研究を遂行して行くにあたり、予備実験としてゲノムを用いたIllumina pair-endシークエンスを実施し、その結果を元に解析を進めていた。その結果、想定外の事由としてmate-pairライブラリの構築などを併用しないと目的のデータが得られないことが判明し、RNA-seqへの適用にはテンプレートの量などが問題となり幅広い発現量の遺伝子からデータを得ることが困難なことが判明した。 そのため、データ解析プログラムの開発を優先しつつ、その間に利用可能な実験手法の検討を加えることにしたため、当初予定していた実験を次年度に回すことになり、次年度使用額が生じることとなった。
|
次年度使用額の使用計画 |
上述の理由の通り、当初の予定に沿った実験では望まれるデータが得られないことが想定されたため、予定を変更しNanoporeシークエンサーの利用を検討している。Nanoporeシークエンサーの仕様はまだ不確定な状況が続いているが、次年度中には落ち着くと思われるため購入を進め、必要な研究を遂行する予定である。
|