2017 Fiscal Year Research-status Report
ロングリード時代に対応したトランスクリプトームデータ解析ガイドラインの構築
Project/Area Number |
15K06919
|
Research Institution | The University of Tokyo |
Principal Investigator |
門田 幸二 東京大学, 大学院農学生命科学研究科(農学部), 特任准教授 (60392221)
|
Project Period (FY) |
2015-10-21 – 2019-03-31
|
Keywords | バイオインフォマティクス / R / トランスクリプトーム |
Outline of Annual Research Achievements |
生体内で発現している転写物配列や発現量を網羅的に調べるトランスクリプトーム解析は、次世代シークエンサ(NGS)を用いたRNA-seqと呼ばれる手段が主流である。解析目的や実験デザインに応じたいくつかの手法が提案されており、手法選択に関する一定のガイドラインも存在する。しかしこの枠組みは、リード長の短いRNA-seqデータに基づくものである。本研究の目的は、今後本格化するミディアム~ロングリード時代のNGS解析に対応すべく、統一的なトランスクリプトーム解析のためのガイドライン構築である。具体的には、研究代表者らがこれまで開発してきた比較トランスクリプトーム解析手法の適用可能範囲の拡張および改良を行う。 平成29年度は、これまで進めてきたサンプル間クラスタリング結果と発現変動解析結果(特に発現変動遺伝子の割合PDEG)の関係についての論文をまとめた。大まかな内容は、比較するグループ間でのPDEG値が大きいほど、クラスタリング結果において比較するグループが明瞭に分かれているという正の相関を、客観的な指標であるシルエットスコア(Silhouette scores)で示し得るというものである。シルエットスコアが0に近いほどPDEG値も0に近づき、クラスタリング結果において比較するグループが入り混じっている点が特に重要である。なぜ発現変動遺伝子が存在しないのかを、サンプル間クラスタリング結果とともに客観的な数値(シルエットスコア)で表現することができるからである。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
従来、クラスタリング時に最適なクラスター数を客観的に評価するためのスコアとして用いられてきたシルエットの新たな利用法を示すことができたため。
|
Strategy for Future Research Activity |
Silhouetteスコアの計算を任意のグループ分けで行う手順書(Rスクリプト)の公開を行うなど、広く普及させるための活動を実施する予定である。
|
Causes of Carryover |
原著論文の投稿から受理までの期間が非常に長く、予算執行の目途が立たなかったため。
|