研究課題/領域番号 |
19K08689
|
研究機関 | 慶應義塾大学 |
研究代表者 |
斎藤 輪太郎 慶應義塾大学, 政策・メディア研究科(藤沢), 特任教授 (40348842)
|
研究期間 (年度) |
2019-04-01 – 2022-03-31
|
キーワード | 急性腎障害 / メタボローム / 機械学習 |
研究実績の概要 |
2020年度は急性腎障害患者の尿メタボロームの解析と、メタボローム生データの情報処理技術の開発(特に「未知ピーク」の処理)を並行して進めた。前者に関しては2019年度に引き続き、研究協力機関である名古屋大学より提供された、急性腎障害検体及び対照検体尿サンプルを用い、時系列メタボロームプロファイルの統計解析および機械学習による疾患発症の予測を進めた。データの時系列性を考慮した「混合モデル」も新たに作成・導入し、急性腎障害を発症した検体とそうでない検体との間でメタボロームプロファイルに差があることをあらためて確認した。今年度はその差の構成要因の中に「未知ピーク」が含まれていたことに特に着目した。
未知ピークは分析装置から出力される波形データのうち、既知物質に対応させることができなかったものであり、ノイズとの区別やデータ解釈の難しさから捨てられてしまうことが多い。一方代表者の研究拠点である先端生命科学研究所では、CE-MSより得られる未知ピークが生理現象に関わる重要物質に対応しうる可能性を度々指摘していた(Sugimoto M et al 2010, Hirayama A et al. 2012等) 。
これを踏まえ、2020年度は未知ピークを効果的に処理・利用する方法の開発に力を注いだ。未知ピークを網羅的に収集し、鶴岡メタボロームコホート研究で収集された約3,000サンプル中のピーク情報も活用しつつ、その信頼性を検証するためのパイプラインの構築を行った。未知ピークの信頼性と相関しうる因子(ピーク検出率、シグナル・ノイズ比、ピーク同士の相関、実験条件によるピーク面積の揺らぎ等)を洗い出し、サンプルを希釈した時の未知ピークの形状変化を調べる実験も実施し、それらをもとに信頼性の高い未知ピークの特徴をまとめた(Saito R et al. J. Clin. Med. 2021)。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
計画段階で掲げた本研究の主な骨子は、(1) メタボロミクスを用いて腎臓病に関わる生体内代謝物質を予測すること、 (2) (1)の結果にさらにネットワーク生物学の方法論を導入し、腎臓病に関わる分子や遺伝子を予測すること、 (3) AI (人工知能)を用いて精度の高い予測を行うこと、(4) 対応する代謝物質が不明な「未知ピーク」を解析に活用すること、である。(1)については、標準的なANOVA(分散分析)および混合モデルを用いた急性腎障害患者の尿メタボロームの統計解析が一通り終わっており、エタノールアミンや未知ピーク等、急性腎障害を発症した患者において特徴的変動を見せる代謝物質を抽出している。(3)に関しては、機械学習の一手法であるLASSOを用いて、尿メタボロームプロファイルから急性腎障害発症の予測モデルの構築を行うとともに、予測に有効な代謝物質を自動抽出した。予測精度を表すAUCは現在70-80%程度である。
これら一連の解析の中で、(4)「未知ピーク」が急性腎障害患者を識別する上で有効となる可能性が改めて示唆されたため、しっかりとその特徴解析をすることに力を注いだ。すなわち、CE-MSから得られる未知ピークがどのような性質を持っていて、信頼性がどの程度あるのか、また、どのような指標を用いれば信頼性の高い未知ピークを抽出できるのかを検証した。最終的には信頼性が高いと思われる未知ピークの特徴を抽出し、また信頼性の高い未知ピークを抽出するパイプラインも構築して論文としてまとめるに至った(Saito R et al. J. Clin. Med. 2021)ため、2020年度は研究が概ね順調に進展したいと考えている。ただ、(1), (3), (4)に重きが置かれた影響で、(2)については、分子ネットワークデータの選定・準備に留まっているため、2021年度に進めてゆく必要がある。
|
今後の研究の推進方策 |
最終年度は、(1) 急性腎障害患者の尿中代謝物質の時系列データのこれまでの解析すなわち、ANOVAや混合モデルを用いた急性腎障害を発症した患者とそうでない患者のメタボロームプロファイルの比較解析およびLASSOによる尿中メタボロームプロファイルからの疾患の発症予測の結果をまとめることを最優先とし、残りの時間配分を考慮しつつ、(2) 未知ピークの効果的な利用法の開発、および(3)腎臓組織内細胞を反映した分子間相互作用ネットワークの構築に取り組む。
(2)に関して、2020年度は信頼性の高い未知ピークをフィルタリングするためのパイプラインの構築を行ったが、その過程は探索的であった。そこで、パイプラインの精度向上・最適化を目指し、ピークの検出率やシグナル・ノイズ比等、パイプライン上の様々なパラメータを変更することによって、抽出される未知ピーク群がどのように変化するか、解析を進める。十分利用に値すると判断された信頼性の高い未知ピークに関しては、(1)に取り入れる予定である。
(3)分子間相互作用ネットワークの構築に関しては、公共データベースで公開されている腎臓組織中の遺伝子発現データやプロテオームデータ等のオミクスデータ、文献情報等を活用し、腎臓細胞の中で起こる分子メカニズムを一定の精度で反映する程度に分子ネットワークを構築することを計画しているが、時間の関係上、自前でネットワークを一から構築するのではなく、精度を妥協しつつ既存の公開された分子ネットワークに少し手を加えて活用することも検討する。ここにメタボローム解析結果をマッピングし、情報科学を用いて疾患に関連があると予測される分子ネットワークを抽出した後、その妥当性を検証し、疾患の分子メカニズムを推定するとともに、疾患に関連のある遺伝子を予測することを目指したい。
|
次年度使用額が生じた理由 |
新型コロナウィルス感染拡大による支出への影響(会議・学会に伴う遠方への移動が困難になり、旅費の支出がなかった、等)のため。2021年度も旅費等、予定していた支出がなくなることが予想されるため、代わりに年度の初めに高性能計算機器(特に近年注目されている深層学習ができるもの)の購入に充てて、計算環境の向上を図る。
|