研究課題/領域番号 |
15K06919
|
研究機関 | 東京大学 |
研究代表者 |
門田 幸二 東京大学, 大学院農学生命科学研究科(農学部), 特任准教授 (60392221)
|
研究期間 (年度) |
2015-10-21 – 2019-03-31
|
キーワード | バイオインフォマティクス / R / トランスクリプトーム |
研究実績の概要 |
生体内で発現している転写物配列や発現量を網羅的に調べるトランスクリプトーム解析は、次世代シークエンサ(NGS)を用いたRNA-seqと呼ばれる手段が主流である。解析目的や実験デザインに応じたいくつかの手法が提案されており、手法選択に関する一定のガイドラインも存在する。しかしこの枠組みは、リード長の短いRNA-seqデータに基づくものである。本研究の目的は、今後本格化するミディアム~ロングリード時代のNGS解析に対応すべく、統一的なトランスクリプトーム解析のためのガイドライン構築である。具体的には、研究代表者らがこれまで開発してきた比較トランスクリプトーム解析手法の適用可能範囲の拡張および改良を行う。 平成29年度は、これまで進めてきたサンプル間クラスタリング結果と発現変動解析結果(特に発現変動遺伝子の割合PDEG)の関係についての論文をまとめた。大まかな内容は、比較するグループ間でのPDEG値が大きいほど、クラスタリング結果において比較するグループが明瞭に分かれているという正の相関を、客観的な指標であるシルエットスコア(Silhouette scores)で示し得るというものである。シルエットスコアが0に近いほどPDEG値も0に近づき、クラスタリング結果において比較するグループが入り混じっている点が特に重要である。なぜ発現変動遺伝子が存在しないのかを、サンプル間クラスタリング結果とともに客観的な数値(シルエットスコア)で表現することができるからである。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
従来、クラスタリング時に最適なクラスター数を客観的に評価するためのスコアとして用いられてきたシルエットの新たな利用法を示すことができたため。
|
今後の研究の推進方策 |
Silhouetteスコアの計算を任意のグループ分けで行う手順書(Rスクリプト)の公開を行うなど、広く普及させるための活動を実施する予定である。
|
次年度使用額が生じた理由 |
原著論文の投稿から受理までの期間が非常に長く、予算執行の目途が立たなかったため。
|