2023 Fiscal Year Research-status Report
RNA-seqデータの発現変動解析を遺伝子クラスタリングで行う
Project/Area Number |
21K12120
|
Research Institution | The University of Tokyo |
Principal Investigator |
門田 幸二 東京大学, 大学院農学生命科学研究科(農学部), 准教授 (60392221)
|
Project Period (FY) |
2021-04-01 – 2025-03-31
|
Keywords | 発現変動解析 / 遺伝子クラスタリング |
Outline of Annual Research Achievements |
比較する状態またはグループ間で発現の異なる遺伝子(DEG)を同定する作業は、多様なトランスクリプトーム研究の中でほぼ例外なく行われてきた。本研究は、DEG検出後の発現パターン分類などこれまで極めて限定的な目的でしか利用されてこなかった遺伝子クラスタリングをDEG検出そのものに利用する試みである。今年度は、2022年度に開発した、内部的にシンプルなサンプルごとの総カウント数を100万にそろえるCPM正規化法を組み込んだMBCdeg3の論文発表を行った(Makino et al., MethodsX, 2023)。MBCdeg論文で用いたTCCパッケージによる様々なシナリオでのシミュレーションデータでの性能評価を行い、MBCdeg3は確かに代表的な手法であるedgeRやDESeq2はもちろんのこと、TCCやMBCdeg1および2よりも高い性能を示すことができた。 また、MBCdeg3論文執筆の過程で、MBCdeg2で実装しているDEGES正規化法はサイズファクタ―に変換した上で組み込んでいるが、どうやらDEGES正規化係数のままで組み込むのが正しそうだということに気づいた点も大きな成果といえる。このように考えることで、「正規化法として明確に劣っているCPM正規化法を組み込んだMBCdeg3」のほうが「DEGESサイズファクターを組み込んだMBCdeg2」よりも優れているという奇妙な結果との辻褄があうためである。本研究の着想から4年越しに、「DEGES正規化係数を組み込んだMBCdeg」が多様なシミュレーションシナリオで最も高い性能を示すであろうという見込みを得ることができた。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
おそらく結果として実装ミスであろうMBCdeg2の性能を大幅に凌駕するMBCdeg3の論文化ができただけでなく、さらにその性能を凌駕しうる「MBCdegアルゴリズムへの正しいDEGES正規化法の組み込み」の目途がたったためである。
|
Strategy for Future Research Activity |
「DEGES正規化係数を組み込んだMBCdeg」の性能評価を行い、論文化を目指す。
|
Causes of Carryover |
人件費を物品費に変更し、それらを令和6年度に購入予定となっているためである。
|