2018 Fiscal Year Annual Research Report
Development of guidelines for transcriptome data analysis with long-reads
Project/Area Number |
15K06919
|
Research Institution | The University of Tokyo |
Principal Investigator |
門田 幸二 東京大学, 大学院農学生命科学研究科(農学部), 准教授 (60392221)
|
Project Period (FY) |
2015-10-21 – 2019-03-31
|
Keywords | バイオインフォマティクス / R / トランスクリプトーム |
Outline of Annual Research Achievements |
生体内で発現している転写物配列や発現量を網羅的に調べるトランスクリプトーム解析は、次世代シークエンサ(NGS)を用いたRNA-seqと呼ばれる手段が主流である。解析目的や実験デザインに応じたいくつかの手法が提案されており、手法選択に関する一定のガイドラインも存在する。本研究の目的は、トランスクリプトームデータ解析ガイドラインの構築であり、昨年度までにサンプル間クラスタリング結果と発現変動解析結果(特に発現変動遺伝子の割合PDEG)の関係についての論文をまとめた。内容は、比較するグループ間でのPDEG値が大きいほど、クラスタリング結果において比較するグループが明瞭に分かれているという正の相関を、客観的な指標であるシルエットスコア(Silhouette scores)で示し得るというものである。 最終年度は、Silhouetteスコアの計算を任意のグループ分けで行う手順書(Rスクリプト)の公開を行い、原著論文中では示さなかった3群間の場合の具体的なやり方を示した。そして、3群間の場合でも妥当な結果を示すことをリアルデータおよびシミュレーションデータで確認した。また、別のプロジェクトで開発したウェブツール(TCC-GUI)の中に組み込むことで、データ解析環境Rの環境構築が難しいユーザもSilhouetteスコアを簡単に算出できるようにした。TCC-GUIの論文公開まで年度内に行うことができた。
|