• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

RNA-seqデータの発現変動解析を遺伝子クラスタリングで行う

研究課題

研究課題/領域番号 21K12120
研究種目

基盤研究(C)

配分区分基金
応募区分一般
審査区分 小区分62010:生命、健康および医療情報学関連
研究機関東京大学

研究代表者

門田 幸二  東京大学, 大学院農学生命科学研究科(農学部), 准教授 (60392221)

研究期間 (年度) 2021-04-01 – 2025-03-31
研究課題ステータス 交付 (2023年度)
配分額 *注記
4,030千円 (直接経費: 3,100千円、間接経費: 930千円)
2024年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2023年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2022年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2021年度: 520千円 (直接経費: 400千円、間接経費: 120千円)
キーワード発現変動解析 / 遺伝子クラスタリング / Rパッケージ / クラスタリング / DEG / RNA-seq
研究開始時の研究の概要

比較するグループ間で発現の異なる遺伝子(DEG)を同定する作業は、多様なトランスクリプトーム研究の中でほぼ例外なく行われてきた。DEG同定精度は下流解析に影響を与えるため、今日でも活発に新規手法開発や性能評価が行われている。本研究は、遺伝子クラスタリングをDEG検出そのものに利用する試みである。これまで誰も考えつかなかったシンプルなアプローチで、知りうる限り最高性能の既存手法を凌駕する結果を出すことを目的とする。後進に対し、本当に有意義な研究であれば流行語を盛り込まなくてもよいこと、そして単なる知識の蓄積のみでは到達しえない「ひらめき」で勝ち切る手法開発系研究者の矜持を手本として示したい。

研究実績の概要

比較する状態またはグループ間で発現の異なる遺伝子(DEG)を同定する作業は、多様なトランスクリプトーム研究の中でほぼ例外なく行われてきた。本研究は、DEG検出後の発現パターン分類などこれまで極めて限定的な目的でしか利用されてこなかった遺伝子クラスタリングをDEG検出そのものに利用する試みである。今年度は、2022年度に開発した、内部的にシンプルなサンプルごとの総カウント数を100万にそろえるCPM正規化法を組み込んだMBCdeg3の論文発表を行った(Makino et al., MethodsX, 2023)。MBCdeg論文で用いたTCCパッケージによる様々なシナリオでのシミュレーションデータでの性能評価を行い、MBCdeg3は確かに代表的な手法であるedgeRやDESeq2はもちろんのこと、TCCやMBCdeg1および2よりも高い性能を示すことができた。
また、MBCdeg3論文執筆の過程で、MBCdeg2で実装しているDEGES正規化法はサイズファクタ―に変換した上で組み込んでいるが、どうやらDEGES正規化係数のままで組み込むのが正しそうだということに気づいた点も大きな成果といえる。このように考えることで、「正規化法として明確に劣っているCPM正規化法を組み込んだMBCdeg3」のほうが「DEGESサイズファクターを組み込んだMBCdeg2」よりも優れているという奇妙な結果との辻褄があうためである。本研究の着想から4年越しに、「DEGES正規化係数を組み込んだMBCdeg」が多様なシミュレーションシナリオで最も高い性能を示すであろうという見込みを得ることができた。

現在までの達成度 (区分)
現在までの達成度 (区分)

1: 当初の計画以上に進展している

理由

おそらく結果として実装ミスであろうMBCdeg2の性能を大幅に凌駕するMBCdeg3の論文化ができただけでなく、さらにその性能を凌駕しうる「MBCdegアルゴリズムへの正しいDEGES正規化法の組み込み」の目途がたったためである。

今後の研究の推進方策

「DEGES正規化係数を組み込んだMBCdeg」の性能評価を行い、論文化を目指す。

報告書

(3件)
  • 2023 実施状況報告書
  • 2022 実施状況報告書
  • 2021 実施状況報告書
  • 研究成果

    (8件)

すべて 2023 2022 2021 その他

すべて 雑誌論文 (6件) (うち査読あり 2件、 オープンアクセス 5件) 学会発表 (1件) (うち招待講演 1件) 備考 (1件)

  • [雑誌論文] Enhanced clustering-based differential expression analysis method for RNA-seq data2023

    • 著者名/発表者名
      Makino M, Shimizu K, Kadota K.
    • 雑誌名

      MethodsX

      巻: 12 ページ: 102518-102518

    • DOI

      10.1016/j.mex.2023.102518

    • 関連する報告書
      2023 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] 次世代シーケンサーデータの解析手法 第21回 シミュレーションデータの生成2023

    • 著者名/発表者名
      利根 悠介、孫 建強、門田 幸二
    • 雑誌名

      日本乳酸菌学会誌

      巻: 34 ページ: 83-90

    • 関連する報告書
      2023 実施状況報告書
  • [雑誌論文] 次世代シーケンサーデータの解析手法 第20回 RNA-seqカウントデータの性質と統計モデル2023

    • 著者名/発表者名
      牧野 磨音, 坂本光央, 清水 謙多郎, 門田 幸二
    • 雑誌名

      日本乳酸菌学会誌

      巻: 34 ページ: 21029-21029

    • 関連する報告書
      2022 実施状況報告書
    • オープンアクセス
  • [雑誌論文] 次世代シーケンサーデータの解析手法:第18回 遺伝子発現データのクラスタリング2022

    • 著者名/発表者名
      牧野 磨音, 清水 謙多郎, 門田 幸二
    • 雑誌名

      日本乳酸菌学会誌

      巻: 33 ページ: 94-103

    • 関連する報告書
      2022 実施状況報告書
    • オープンアクセス
  • [雑誌論文] 次世代シーケンサーデータの解析手法 第19回 R Markdown2022

    • 著者名/発表者名
      牧野 磨音, 清水 謙多郎, 門田 幸二
    • 雑誌名

      日本乳酸菌学会誌

      巻: 33 ページ: 195-205

    • 関連する報告書
      2022 実施状況報告書
    • オープンアクセス
  • [雑誌論文] Differential expression analysis using a model-based gene clustering algorithm for RNA-seq data.2021

    • 著者名/発表者名
      Osabe, T., Shimizu, K., and Kadota, K.
    • 雑誌名

      BMC Bioinformatics

      巻: 22 号: 1 ページ: 51-51

    • DOI

      10.1186/s12859-021-04438-4

    • 関連する報告書
      2021 実施状況報告書
    • 査読あり / オープンアクセス
  • [学会発表] バイオインフォマティクス教育の今後2021

    • 著者名/発表者名
      門田幸二
    • 学会等名
      日本農芸化学会 中部支部 第190回例会
    • 関連する報告書
      2021 実施状況報告書
    • 招待講演
  • [備考] (Rで)塩基配列解析のサブ

    • URL

      https://www.iu.a.u-tokyo.ac.jp/kadota/r_seq2.html

    • 関連する報告書
      2022 実施状況報告書

URL: 

公開日: 2021-04-28   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi