2021 Fiscal Year Research-status Report
RNA-seqデータの発現変動解析を遺伝子クラスタリングで行う
Project/Area Number |
21K12120
|
Research Institution | The University of Tokyo |
Principal Investigator |
門田 幸二 東京大学, 大学院情報学環・学際情報学府, 准教授 (60392221)
|
Project Period (FY) |
2021-04-01 – 2025-03-31
|
Keywords | 遺伝子クラスタリング / Rパッケージ / 発現変動解析 |
Outline of Annual Research Achievements |
比較する状態またはグループ間で発現の異なる遺伝子(DEG)を同定する作業は、多様なトランスクリプトーム研究の中でほぼ例外なく行われてきた。本研究は、DEG検出後の発現パターン分類などこれまで極めて限定的な目的でしか利用されてこなかった遺伝子クラスタリングをDEG検出そのものに利用する試みである。2021年度は、使い慣れた遺伝子クラスタリング用のRパッケージであるMBCluster.Seqをベースとして開発したDEG同定アルゴリズムの試作版であるMBCdegの論文発表まで行うことができた(Osabe et al., BMC Bioinformatics, 2021)。 MBCluster.Seq(MBCdegを含む)は、クラスター数Kを予め指定して実行するK-meansを内部的に用いている。この種のアルゴリズムは、クラスターごとに事後確率を出力する。比較する群間で変動が最も小さいクラスター中心をもつものをnon-DEGクラスターと定義し、その事後確率の低さを発現変動の度合いの高さと解釈するというのが提案手法の核心である。 この業界では、平凡な性能をもつ有名な手法のみを都合よくベンチマークとして利用して、自分たちの手法の優位性を主張する論文が横行している(Kadota and Shimizu, Front Genet., 2020)。このアルゴリズムの驚異的な点は、この分野で有名なedgeRやDESeq2などよりも高性能なTCCを、全く同じ土俵で軽く上回る性能をすでに示していることである。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
基本アルゴリズムに関する論文発表まで予定通りこぎつけたためである。尚、MBCdeg論文発表後に、同じコンセプトである遺伝子クラスタリングに基づくDEG検出法の論文(Vavoulis et al., Genome Biol., 2015)の存在に気づいた。この論文の存在に気づかなかった一番の理由は、彼らの論文中では我々が中核として用いたMBCluster.Seq論文が引用されていなかったためである。しかしながら、このプログラム(DGEclust)の更新は止まっており、MBCdeg論文と同じ条件で実行してもうまく動作しないなど不具合が多いことは確認済みである。
|
Strategy for Future Research Activity |
引き続き、なぜDEG同定専用プログラムであるTCCよりも高い精度を示すのかについて、実は重大な欠点があるのでは?といった点を丁寧に調べ、適用可能範囲を明らかにしたい。具体的には、MBCdeg論文では、TCCのシミュレーションデータを中心として評価を行ったが、他のパッケージで作成されたシミュレーションデータを用いて同様の傾向が得られるのかを明らかにしていく予定である。
|
Causes of Carryover |
論文投稿料は為替によって変動するためである。
|
Research Products
(2 results)