研究実績の概要 |
比較する状態またはグループ間で発現の異なる遺伝子(DEG)を同定する作業は、多様なトランスクリプトーム研究の中でほぼ例外なく行われてきた。本研究は、DEG検出後の発現パターン分類などこれまで極めて限定的な目的でしか利用されてこなかった遺伝子クラスタリングをDEG検出そのものに利用する試みである。今年度は、2022年度に開発した、内部的にシンプルなサンプルごとの総カウント数を100万にそろえるCPM正規化法を組み込んだMBCdeg3の論文発表を行った(Makino et al., MethodsX, 2023)。MBCdeg論文で用いたTCCパッケージによる様々なシナリオでのシミュレーションデータでの性能評価を行い、MBCdeg3は確かに代表的な手法であるedgeRやDESeq2はもちろんのこと、TCCやMBCdeg1および2よりも高い性能を示すことができた。 また、MBCdeg3論文執筆の過程で、MBCdeg2で実装しているDEGES正規化法はサイズファクタ―に変換した上で組み込んでいるが、どうやらDEGES正規化係数のままで組み込むのが正しそうだということに気づいた点も大きな成果といえる。このように考えることで、「正規化法として明確に劣っているCPM正規化法を組み込んだMBCdeg3」のほうが「DEGESサイズファクターを組み込んだMBCdeg2」よりも優れているという奇妙な結果との辻褄があうためである。本研究の着想から4年越しに、「DEGES正規化係数を組み込んだMBCdeg」が多様なシミュレーションシナリオで最も高い性能を示すであろうという見込みを得ることができた。
|