• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2017 年度 実施状況報告書

ロングリード時代に対応したトランスクリプトームデータ解析ガイドラインの構築

研究課題

研究課題/領域番号 15K06919
研究機関東京大学

研究代表者

門田 幸二  東京大学, 大学院農学生命科学研究科(農学部), 特任准教授 (60392221)

研究期間 (年度) 2015-10-21 – 2019-03-31
キーワードバイオインフォマティクス / R / トランスクリプトーム
研究実績の概要

生体内で発現している転写物配列や発現量を網羅的に調べるトランスクリプトーム解析は、次世代シークエンサ(NGS)を用いたRNA-seqと呼ばれる手段が主流である。解析目的や実験デザインに応じたいくつかの手法が提案されており、手法選択に関する一定のガイドラインも存在する。しかしこの枠組みは、リード長の短いRNA-seqデータに基づくものである。本研究の目的は、今後本格化するミディアム~ロングリード時代のNGS解析に対応すべく、統一的なトランスクリプトーム解析のためのガイドライン構築である。具体的には、研究代表者らがこれまで開発してきた比較トランスクリプトーム解析手法の適用可能範囲の拡張および改良を行う。
平成29年度は、これまで進めてきたサンプル間クラスタリング結果と発現変動解析結果(特に発現変動遺伝子の割合PDEG)の関係についての論文をまとめた。大まかな内容は、比較するグループ間でのPDEG値が大きいほど、クラスタリング結果において比較するグループが明瞭に分かれているという正の相関を、客観的な指標であるシルエットスコア(Silhouette scores)で示し得るというものである。シルエットスコアが0に近いほどPDEG値も0に近づき、クラスタリング結果において比較するグループが入り混じっている点が特に重要である。なぜ発現変動遺伝子が存在しないのかを、サンプル間クラスタリング結果とともに客観的な数値(シルエットスコア)で表現することができるからである。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

従来、クラスタリング時に最適なクラスター数を客観的に評価するためのスコアとして用いられてきたシルエットの新たな利用法を示すことができたため。

今後の研究の推進方策

Silhouetteスコアの計算を任意のグループ分けで行う手順書(Rスクリプト)の公開を行うなど、広く普及させるための活動を実施する予定である。

次年度使用額が生じた理由

原著論文の投稿から受理までの期間が非常に長く、予算執行の目途が立たなかったため。

  • 研究成果

    (2件)

すべて 2018 その他

すべて 雑誌論文 (1件) (うち査読あり 1件、 オープンアクセス 1件) 備考 (1件)

  • [雑誌論文] Silhouette scores for arbitrary defined groups in gene expression data and insights into differential expression results.2018

    • 著者名/発表者名
      Zhao S, Sun J, Shimizu K, Kadota K
    • 雑誌名

      Biol Proced Online

      巻: 20 ページ: 5

    • DOI

      https://doi.org/10.1186/s12575-018-0067-8

    • 査読あり / オープンアクセス
  • [備考] (Rで)塩基配列解析

    • URL

      http://www.iu.a.u-tokyo.ac.jp/~kadota/r_seq.html

URL: 

公開日: 2018-12-17  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi