Project/Area Number |
21K17852
|
Research Category |
Grant-in-Aid for Early-Career Scientists
|
Allocation Type | Multi-year Fund |
Review Section |
Basic Section 62010:Life, health and medical informatics-related
|
Research Institution | Nagoya University |
Principal Investigator |
宇野 光平 名古屋大学, 医学系研究科(保健), 助教 (50873585)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥2,470,000 (Direct Cost: ¥1,900,000、Indirect Cost: ¥570,000)
Fiscal Year 2022: ¥520,000 (Direct Cost: ¥400,000、Indirect Cost: ¥120,000)
Fiscal Year 2021: ¥1,950,000 (Direct Cost: ¥1,500,000、Indirect Cost: ¥450,000)
|
Keywords | プロテオミクス解析 / 欠損値補完 / 統計的バイアス / 欠測値データ解析 / プロテオミクス / 統合オミクス解析 |
Outline of Research at the Start |
近年大規模なプロテオーム解析が可能となったことで、バイオマーカー候補の報告が年々増加している。しかし、大規模タンパク質発現データに対する解析基盤は十分に整っていないことが問題となっている。特にデータ欠測率が高いため欠測値の補完が必要であるにもかかわらず、既存の欠測値補完手法にはバイアスが存在するため発現差異解析に多くの偽陽性を含む可能性があることがわかってきた。そこで本研究ではバイアスのない欠測値補完手法を開発し、データ欠測を克服したがんシステムの俯瞰的理解のためのプロテオーム解析基盤を構築する。
|
Outline of Annual Research Achievements |
プロテオミクス解析は、LC-MS/MSを用いたタンパク質存在量推定技術によって網羅的な解析が可能となった。ただし、LC-MS/MSによる存在量の推定には欠測値が多く生じるという問題点がある。そこで発現差異解析などの統計的手法を適用するためには、欠測部分に推定値を代入する欠測値補完が前処理として必要になる。 これまでに多くの欠測値補完手法が提案されていることから、どの手法がプロテオミクス解析のための前処理として有用かを検証するシミュレーション研究が行われている。ところが、これらの性能比較研究で用いられる指標は、データ点の再現を評価するRoot Mean Square Error (RMSE) が中心であり、t検定に用いるパラメータである各タンパク存在量の分散や平均には着目していなかった。実際にシミュレーション研究によって検証したところ、これまでに用いられてきた代表的な欠測値補完手法を適用した後の補完後データでは分散が過小推定されるという分散バイアスが存在することが明らかとなった。分散の過小推定はt検定の偽陽性につながる恐れがあるため、補正が必要となる。 このようなバイアスが見過ごされてきた原因の1つに、評価指標の欠如が考えられる。そこで、まずは欠測値補完を評価するための新たな指標を開発した。新たに開発した指標では、分散や平均などデータ点ではなくデータ構造の再現を評価する。さらに、指標の基準に基づいて最適な分散バイアス補正の手法を開発した。この手法はすでに欠測値補完された補完後データの過小分散を補正するものである。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
研究の有用性と応用可能性を探るためシミュレーションやデータ解析を通じての検証を重ねていた。そのため、論文投稿まで多くの時間を要してしまった。
|
Strategy for Future Research Activity |
今後はまとまった研究成果を学会発表するとともに、学術雑誌に論文を投稿する。
|