2016 Fiscal Year Research-status Report
ロングリード時代に対応したトランスクリプトームデータ解析ガイドラインの構築
Project/Area Number |
15K06919
|
Research Institution | The University of Tokyo |
Principal Investigator |
門田 幸二 東京大学, 大学院農学生命科学研究科(農学部), 特任准教授 (60392221)
|
Project Period (FY) |
2015-10-21 – 2018-03-31
|
Keywords | トランスクリプトーム / バイオインフォマティクス / クラスタリング |
Outline of Annual Research Achievements |
生体内で発現している転写物配列や発現量を網羅的に調べるトランスクリプトーム解析は、次世代シークエンサ(NGS)を用いたRNA-seqと呼ばれる手段が主流である。解析目的や実験デザインに応じたいくつかの手法が提案されており、手法選択に関する一定のガイドラインも存在する。しかしこの枠組みは、リード長の短いRNA-seqデータに基づくものである。本研究の目的は、今後本格化するミディアム~ロングリード時代のNGS解析に対応すべく、統一的なトランスクリプトーム解析のためのガイドライン構築である。具体的には、研究代表者らがこれまで開発してきた比較トランスクリプトーム解析手法の適用可能範囲の拡張および改良を行う。 平成28年度は、ロングリードの代表格であるPacBioデータを用いた発現解析について検討を行った。結果として、(1) PacBioの生データ形式(bax/bas.h5)は一般的な形式(FASTQ)とは異なっていること、(2) 公共データベース(DB)から利用可能な一般的な形式に変換した後のデータだとリード数が大幅に少ないこと、(3) 公共DBではPacBioの生データが提供されていないことなど、ロングリードデータを用いた発現解析を行うことが困難であることがわかり、そのことを解説記事にまとめた。また、昨年度の成果である発現変動解析の推奨ガイドラインに関する研究から着想を得て、サンプル間クラスタリング結果と発現変動解析結果(特に発現変動遺伝子の割合PDEG)の関連性を見出した。具体的には、比較するグループ間でのPDEG値が大きいほど、クラスタリング結果において比較するグループが明瞭に分かれているという正の相関を見出すことができた。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
公共DBから提供されているロングリードデータを取り扱うのが困難であるということが分かったこと、そしてこれまで独立に行われてきたサンプル間クラスタリングと発現変動解析結果に相関がみられることを見出したからである。
|
Strategy for Future Research Activity |
サンプル間クラスタリングと発現変動解析結果の相関に関する研究をまとめる。また、平成27年度の報告で記載した、3群間比較の発現変動解析結果として得られる「どこかの群間で発現変動している順にソート」したものに加えて、どの群間で発現変動しているのかまでを示した発現パターン分類まで行う枠組みの提供を目指す。
|
Causes of Carryover |
ロングリードデータを用いた発現解析の実現可能性を探るべく、学術支援職員を雇用(人件費を計上)したこと、成果発表よりも研究を優先的に行ったことによる。
|
Expenditure Plan for Carryover Budget |
研究成果発表や学会発表費用などに充てる予定である。
|