2023 Fiscal Year Annual Research Report
大規模プロテオーム解析による俯瞰的がんシステム理解に向けた解析基盤の構築
Project/Area Number |
21K17852
|
Research Institution | Nagoya University |
Principal Investigator |
宇野 光平 名古屋大学, 医学系研究科(保健), 助教 (50873585)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Keywords | プロテオーム解析 / 欠測値補完 / バイオマーカー探索 / バイアス |
Outline of Annual Research Achievements |
大規模なタンパク質存在量の推定には、欠測値が生じることが知られている。これはタンパク質存在量データをもとにしたプロテオーム解析の妨げになることから、欠測値に推定値を代入する欠測値補完がデータ解析の前処理として求められる。 既存の欠測値補完手法はその多くが分散の過小推定バイアスがあり、t検定をはじめとする検定手法によるバイオマーカー探索の偽陽性の可能性を高める恐れがある。このようなバイアスがプロテオーム解析で議論されてこなかった要因として、欠測値補完手法の性能評価方法に問題があることが挙げられる。数多く提案されている欠測値補完手法のうち、どの手法を使うべきかを評価するために、補完データと完全データのデータ点距離であるRoot Mean Square Error (RMSE) が用いられてきた。しかし、バイオマーカー探索にはデータ自体の復元よりも平均や分散、相関といったデータ構造の復元が重要になってくる。こうした問題を踏まえて行った研究の成果は、以下のようにまとめることができる。
[1] 従来のRMSEに変わる欠測値補完手法の評価指標として、タンパク質存在量平均の復元や分散の復元といったデータ構造の復元を評価する新たな指標を提案した。
[2] 分散の過小推定バイアスを修正するアルゴリズムを提案した。従来の欠測値補完手法では偽陽性の割合が高まっていたが、提案手法を用いることで偽陽性を抑制できることがシミュレーションによる検証によって明らかになった。
|