研究課題/領域番号 |
21K12120
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分62010:生命、健康および医療情報学関連
|
研究機関 | 東京大学 |
研究代表者 |
門田 幸二 東京大学, 大学院農学生命科学研究科(農学部), 准教授 (60392221)
|
研究期間 (年度) |
2021-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,030千円 (直接経費: 3,100千円、間接経費: 930千円)
2024年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2023年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2022年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2021年度: 520千円 (直接経費: 400千円、間接経費: 120千円)
|
キーワード | 発現変動解析 / 遺伝子クラスタリング / Rパッケージ / クラスタリング / DEG / RNA-seq |
研究開始時の研究の概要 |
比較するグループ間で発現の異なる遺伝子(DEG)を同定する作業は、多様なトランスクリプトーム研究の中でほぼ例外なく行われてきた。DEG同定精度は下流解析に影響を与えるため、今日でも活発に新規手法開発や性能評価が行われている。本研究は、遺伝子クラスタリングをDEG検出そのものに利用する試みである。これまで誰も考えつかなかったシンプルなアプローチで、知りうる限り最高性能の既存手法を凌駕する結果を出すことを目的とする。後進に対し、本当に有意義な研究であれば流行語を盛り込まなくてもよいこと、そして単なる知識の蓄積のみでは到達しえない「ひらめき」で勝ち切る手法開発系研究者の矜持を手本として示したい。
|
研究実績の概要 |
比較する状態またはグループ間で発現の異なる遺伝子(DEG)を同定する作業は、多様なトランスクリプトーム研究の中でほぼ例外なく行われてきた。本研究は、DEG検出後の発現パターン分類などこれまで極めて限定的な目的でしか利用されてこなかった遺伝子クラスタリングをDEG検出そのものに利用する試みである。今年度は、2022年度に開発した、内部的にシンプルなサンプルごとの総カウント数を100万にそろえるCPM正規化法を組み込んだMBCdeg3の論文発表を行った(Makino et al., MethodsX, 2023)。MBCdeg論文で用いたTCCパッケージによる様々なシナリオでのシミュレーションデータでの性能評価を行い、MBCdeg3は確かに代表的な手法であるedgeRやDESeq2はもちろんのこと、TCCやMBCdeg1および2よりも高い性能を示すことができた。 また、MBCdeg3論文執筆の過程で、MBCdeg2で実装しているDEGES正規化法はサイズファクタ―に変換した上で組み込んでいるが、どうやらDEGES正規化係数のままで組み込むのが正しそうだということに気づいた点も大きな成果といえる。このように考えることで、「正規化法として明確に劣っているCPM正規化法を組み込んだMBCdeg3」のほうが「DEGESサイズファクターを組み込んだMBCdeg2」よりも優れているという奇妙な結果との辻褄があうためである。本研究の着想から4年越しに、「DEGES正規化係数を組み込んだMBCdeg」が多様なシミュレーションシナリオで最も高い性能を示すであろうという見込みを得ることができた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
おそらく結果として実装ミスであろうMBCdeg2の性能を大幅に凌駕するMBCdeg3の論文化ができただけでなく、さらにその性能を凌駕しうる「MBCdegアルゴリズムへの正しいDEGES正規化法の組み込み」の目途がたったためである。
|
今後の研究の推進方策 |
「DEGES正規化係数を組み込んだMBCdeg」の性能評価を行い、論文化を目指す。
|