• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2021 Fiscal Year Research-status Report

RNA-seqデータの発現変動解析を遺伝子クラスタリングで行う

Research Project

Project/Area Number 21K12120
Research InstitutionThe University of Tokyo

Principal Investigator

門田 幸二  東京大学, 大学院情報学環・学際情報学府, 准教授 (60392221)

Project Period (FY) 2021-04-01 – 2025-03-31
Keywords遺伝子クラスタリング / Rパッケージ / 発現変動解析
Outline of Annual Research Achievements

比較する状態またはグループ間で発現の異なる遺伝子(DEG)を同定する作業は、多様なトランスクリプトーム研究の中でほぼ例外なく行われてきた。本研究は、DEG検出後の発現パターン分類などこれまで極めて限定的な目的でしか利用されてこなかった遺伝子クラスタリングをDEG検出そのものに利用する試みである。2021年度は、使い慣れた遺伝子クラスタリング用のRパッケージであるMBCluster.Seqをベースとして開発したDEG同定アルゴリズムの試作版であるMBCdegの論文発表まで行うことができた(Osabe et al., BMC Bioinformatics, 2021)。
MBCluster.Seq(MBCdegを含む)は、クラスター数Kを予め指定して実行するK-meansを内部的に用いている。この種のアルゴリズムは、クラスターごとに事後確率を出力する。比較する群間で変動が最も小さいクラスター中心をもつものをnon-DEGクラスターと定義し、その事後確率の低さを発現変動の度合いの高さと解釈するというのが提案手法の核心である。
この業界では、平凡な性能をもつ有名な手法のみを都合よくベンチマークとして利用して、自分たちの手法の優位性を主張する論文が横行している(Kadota and Shimizu, Front Genet., 2020)。このアルゴリズムの驚異的な点は、この分野で有名なedgeRやDESeq2などよりも高性能なTCCを、全く同じ土俵で軽く上回る性能をすでに示していることである。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

基本アルゴリズムに関する論文発表まで予定通りこぎつけたためである。尚、MBCdeg論文発表後に、同じコンセプトである遺伝子クラスタリングに基づくDEG検出法の論文(Vavoulis et al., Genome Biol., 2015)の存在に気づいた。この論文の存在に気づかなかった一番の理由は、彼らの論文中では我々が中核として用いたMBCluster.Seq論文が引用されていなかったためである。しかしながら、このプログラム(DGEclust)の更新は止まっており、MBCdeg論文と同じ条件で実行してもうまく動作しないなど不具合が多いことは確認済みである。

Strategy for Future Research Activity

引き続き、なぜDEG同定専用プログラムであるTCCよりも高い精度を示すのかについて、実は重大な欠点があるのでは?といった点を丁寧に調べ、適用可能範囲を明らかにしたい。具体的には、MBCdeg論文では、TCCのシミュレーションデータを中心として評価を行ったが、他のパッケージで作成されたシミュレーションデータを用いて同様の傾向が得られるのかを明らかにしていく予定である。

Causes of Carryover

論文投稿料は為替によって変動するためである。

  • Research Products

    (2 results)

All 2021

All Journal Article (1 results) (of which Peer Reviewed: 1 results,  Open Access: 1 results) Presentation (1 results) (of which Invited: 1 results)

  • [Journal Article] Differential expression analysis using a model-based gene clustering algorithm for RNA-seq data.2021

    • Author(s)
      Osabe, T., Shimizu, K., and Kadota, K.
    • Journal Title

      BMC Bioinformatics

      Volume: 22 Pages: 51

    • DOI

      10.1186/s12859-021-04438-4

    • Peer Reviewed / Open Access
  • [Presentation] バイオインフォマティクス教育の今後2021

    • Author(s)
      門田幸二
    • Organizer
      日本農芸化学会 中部支部 第190回例会
    • Invited

URL: 

Published: 2022-12-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi