• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2016 Fiscal Year Research-status Report

ロングリード時代に対応したトランスクリプトームデータ解析ガイドラインの構築

Research Project

Project/Area Number 15K06919
Research InstitutionThe University of Tokyo

Principal Investigator

門田 幸二  東京大学, 大学院農学生命科学研究科(農学部), 特任准教授 (60392221)

Project Period (FY) 2015-10-21 – 2018-03-31
Keywordsトランスクリプトーム / バイオインフォマティクス / クラスタリング
Outline of Annual Research Achievements

生体内で発現している転写物配列や発現量を網羅的に調べるトランスクリプトーム解析は、次世代シークエンサ(NGS)を用いたRNA-seqと呼ばれる手段が主流である。解析目的や実験デザインに応じたいくつかの手法が提案されており、手法選択に関する一定のガイドラインも存在する。しかしこの枠組みは、リード長の短いRNA-seqデータに基づくものである。本研究の目的は、今後本格化するミディアム~ロングリード時代のNGS解析に対応すべく、統一的なトランスクリプトーム解析のためのガイドライン構築である。具体的には、研究代表者らがこれまで開発してきた比較トランスクリプトーム解析手法の適用可能範囲の拡張および改良を行う。
平成28年度は、ロングリードの代表格であるPacBioデータを用いた発現解析について検討を行った。結果として、(1) PacBioの生データ形式(bax/bas.h5)は一般的な形式(FASTQ)とは異なっていること、(2) 公共データベース(DB)から利用可能な一般的な形式に変換した後のデータだとリード数が大幅に少ないこと、(3) 公共DBではPacBioの生データが提供されていないことなど、ロングリードデータを用いた発現解析を行うことが困難であることがわかり、そのことを解説記事にまとめた。また、昨年度の成果である発現変動解析の推奨ガイドラインに関する研究から着想を得て、サンプル間クラスタリング結果と発現変動解析結果(特に発現変動遺伝子の割合PDEG)の関連性を見出した。具体的には、比較するグループ間でのPDEG値が大きいほど、クラスタリング結果において比較するグループが明瞭に分かれているという正の相関を見出すことができた。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

公共DBから提供されているロングリードデータを取り扱うのが困難であるということが分かったこと、そしてこれまで独立に行われてきたサンプル間クラスタリングと発現変動解析結果に相関がみられることを見出したからである。

Strategy for Future Research Activity

サンプル間クラスタリングと発現変動解析結果の相関に関する研究をまとめる。また、平成27年度の報告で記載した、3群間比較の発現変動解析結果として得られる「どこかの群間で発現変動している順にソート」したものに加えて、どの群間で発現変動しているのかまでを示した発現パターン分類まで行う枠組みの提供を目指す。

Causes of Carryover

ロングリードデータを用いた発現解析の実現可能性を探るべく、学術支援職員を雇用(人件費を計上)したこと、成果発表よりも研究を優先的に行ったことによる。

Expenditure Plan for Carryover Budget

研究成果発表や学会発表費用などに充てる予定である。

  • Research Products

    (4 results)

All 2016 Other

All Journal Article (2 results) (of which Open Access: 2 results,  Acknowledgement Compliant: 2 results) Presentation (1 results) Remarks (1 results)

  • [Journal Article] 次世代シーケンサーデータの解析手法:第7回ロングリードアセンブリ2016

    • Author(s)
      谷澤靖洋, 神沼英里, 中村保一, 遠野雅徳, 大崎研, 清水謙多郎, 門田幸二
    • Journal Title

      日本乳酸菌学会誌

      Volume: 27 Pages: 101-110

    • Open Access / Acknowledgement Compliant
  • [Journal Article] 次世代シーケンサーデータの解析手法:第8回アセンブリ後の解析2016

    • Author(s)
      谷澤靖洋, 神沼英里, 中村保一, 遠野雅徳, 寺田朋子, 清水謙多郎, 門田幸二
    • Journal Title

      日本乳酸菌学会誌

      Volume: 27 Pages: 187-195

    • Open Access / Acknowledgement Compliant
  • [Presentation] NGS解析(中~上級)クラウド環境との連携、ロングリードデータの解析2016

    • Author(s)
      門田幸二
    • Organizer
      平成28年度NGSハンズオン講習会
    • Place of Presentation
      東京大学(東京都 文京区)
    • Year and Date
      2016-08-03 – 2016-08-03
  • [Remarks] (Rで)塩基配列解析

    • URL

      http://www.iu.a.u-tokyo.ac.jp/~kadota/r_seq.html

URL: 

Published: 2018-01-16  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi