研究実績の概要 |
比較する状態またはグループ間で発現の異なる遺伝子(DEG)を同定する作業は、多様なトランスクリプトーム研究の中でほぼ例外なく行われてきた。本研究は、DEG検出後の発現パターン分類などこれまで極めて限定的な目的でしか利用されてこなかった遺伝子クラスタリングをDEG検出そのものに利用する試みである。2021年度は、使い慣れた遺伝子クラスタリング用のRパッケージであるMBCluster.Seqをベースとして開発したDEG同定アルゴリズムの試作版であるMBCdegの論文発表まで行うことができた(Osabe et al., BMC Bioinformatics, 2021)。 MBCluster.Seq(MBCdegを含む)は、クラスター数Kを予め指定して実行するK-meansを内部的に用いている。この種のアルゴリズムは、クラスターごとに事後確率を出力する。比較する群間で変動が最も小さいクラスター中心をもつものをnon-DEGクラスターと定義し、その事後確率の低さを発現変動の度合いの高さと解釈するというのが提案手法の核心である。 この業界では、平凡な性能をもつ有名な手法のみを都合よくベンチマークとして利用して、自分たちの手法の優位性を主張する論文が横行している(Kadota and Shimizu, Front Genet., 2020)。このアルゴリズムの驚異的な点は、この分野で有名なedgeRやDESeq2などよりも高性能なTCCを、全く同じ土俵で軽く上回る性能をすでに示していることである。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
基本アルゴリズムに関する論文発表まで予定通りこぎつけたためである。尚、MBCdeg論文発表後に、同じコンセプトである遺伝子クラスタリングに基づくDEG検出法の論文(Vavoulis et al., Genome Biol., 2015)の存在に気づいた。この論文の存在に気づかなかった一番の理由は、彼らの論文中では我々が中核として用いたMBCluster.Seq論文が引用されていなかったためである。しかしながら、このプログラム(DGEclust)の更新は止まっており、MBCdeg論文と同じ条件で実行してもうまく動作しないなど不具合が多いことは確認済みである。
|