腎臓病メタボロームの統合データ解析パイプラインの構築

研究課題

研究課題/領域番号	22K08317
研究種目	基盤研究(C)
配分区分	基金
応募区分	一般
審査区分	小区分53040:腎臓内科学関連
研究機関	慶應義塾大学
研究代表者	斎藤輪太郎慶應義塾大学, 政策・メディア研究科(藤沢), 特任教授 (40348842)
研究分担者	安田宜成名古屋大学, 医学系研究科, 特任准教授 (60432259)
研究期間 (年度)	2022-04-01 – 2025-03-31
研究課題ステータス	交付 (2023年度)
配分額 *注記	4,160千円 (直接経費: 3,200千円、間接経費: 960千円) 2024年度: 910千円 (直接経費: 700千円、間接経費: 210千円) 2023年度: 780千円 (直接経費: 600千円、間接経費: 180千円) 2022年度: 2,470千円 (直接経費: 1,900千円、間接経費: 570千円)
キーワード	メタボローム / 腎臓病 / インフォマティクス / バイオインフォマティクス / ネットワーク / データ解析 / システム生物学 / ソフトウェア
研究開始時の研究の概要	腎臓病患者の血液・尿等を分析して得られたメタボロームデータ(網羅的な代謝物質の情報)を公共データと効果的に統合し、解析するためのソフトウェアのパイプラインを構築する。すなわち、機械学習等AIの技術を利用して、腎臓病に関わる可能性の高い代謝物質を抽出するとともに、公共の腎臓組織中の酵素遺伝子発現データや分子間相互作用ネットワークとの統合解析・可視化を行い、メタボローム解析の結果解釈を加速するパイプラインを構築する。これによって従来よりも高精度でより多くの代謝物質の制御因子を予測し、腎臓病が進行する分子メカニズムの考察を深められるとともに、実験による検証のターゲットを提供できる。
研究実績の概要	2023年度はメタボローム生データの情報処理技術の開発を行った。本研究で主に使用されるメタボローム分析装置CE-TOFMSより得られる生データの容量は1サンプル当たり500MB～3GBにもなるため、解析するサンプル数が増えると、記憶装置の容量が圧迫されるとともに、代謝物質情報抽出のための精密な情報処理をする時間も大変長くなってしまうことが問題となっていた。そこで、これら大量のメタボローム生データよりノイズと思われる部分を除去し、代謝物質に関する情報を含んでいると思われる部分(ROI, region of interest)を抽出する手法の開発を2つのアプローチから行った。1つは、データ中にはノイズしかない部分があるというCE-TOFMSの生データの特徴を生かし、この部分の統計学的特徴を解析し、それをもとに、それ以外のデータ部分の正規化を行って、ノイズにはない統計的特徴がある部分をROIとして特定する処理を行った。また、画像の機械学習等で用いられる「畳み込み」という手法を応用し、捉えた特徴をさらに浮き上がらせる処理を重ねた。その結果、通常の分析で対象としている代謝物質60種類 (陽イオン)に対応するデータ部分を全てROIとして抽出しつつ、データ容量を1/30～1/170に圧縮することができた。圧縮したデータは標準化された形式(mzML)に変換し、xcms等、広く用いられているメタボローム情報処理用フリーソフトウェアで扱えるようにした。またこれと並行して、共同研究機関である名古屋大学と実際の腎臓病に関連したメタボロームの解析(長期間透析患者の血漿メタボロームプロファイルの解析等)を進めている。さらに、テキサス大学サンアントニオ校とも糖尿病性腎症の患者の尿中メタボロームの解析を行い、糖尿病性腎症の患者の腎臓細胞中のミトコンドリア内の分子ネットワークおよび機能低下について考察した。
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由本研究課題では申請時点より3つの「柱」をもとにした研究計画を立てている。柱1は公開されているメタボロームデータを統合解析するための情報科学的手法の開発、柱2は機械学習の仕組みを実装しデータ処理の精度・効果を向上させること、柱3はメタボローム分析装置より直接得られるメタボローム生データの高度な情報処理である。 2022年度は柱1の一環として、既に「加工・整形」された表形式のメタボロームデータの解析方法の開発に力を入れ、iDMETという複数機関より得られた性質の異なるメタボロームデータを統合解析する手法を開発・公表する等、一定の成果を挙げることができた。2023年度は柱2と3の一環として「加工・整形」前の「生データ」を解析の対象とし、機械学習の技術も利用しつつ、コホート研究から得られるような大量のメタボロームの生データでも現実的な時間内で効率良く処理するためのソフトウェアの開発に注力した。ここで、研究計画と照らし合わせて重要となった達成必須項目は(1) 誰でも使用・改良ができるようなフリーソフトウェアを用いたパイプラインを構築すること、(2) 大規模メタボロームデータの容量を大幅に削減し、大容量ポータブルハードディスクドライブ数個でも1万人規模のデータを扱えるようにすること、である。後者の(2)については、CE-TOFMSの生データからノイズである可能性が高い領域を除去することによってデータ容量を1/30～1/170に圧縮できる手法を開発し、また(1)に対応すべく、圧縮済のデータをフリーソフトウェアで扱えるように標準形式に変換できる機能を組み込んだ。このような手法の開発と並行して、腎臓病患者より得られた実際のメタボロームデータの解析を分担研究機関である名古屋大学や新規共同研究機関であるテキサス大学サンアントニオ校と進めており、当初の計画に沿って研究が着実に進んでいると考えている。
今後の研究の推進方策	2023年度までにメタボロームの生データ処理手法の開発、複数機関由来の「加工・整形」済メタボロームデータの統合技術の開発(iDMET)、実際の腎臓患者由来の検体のメタボロームプロファイル解析等、計画した項目を一通りなぞることができた。最終年度は2023年度に開発したメタボローム生データ処理手法とフリーソフトウェアを組み合わせ、メタボロームデータ処理の各段階(ROI抽出によるデータ削減、ROIからの代謝物質に対応する波形パターン「ピーク」の抽出、代謝物質同定、定量等)を自動的に進めるようなソフトウェアパイプラインの構築を進める。そのためにまず、生データ処理手法によって得られた縮小データをxcms (Bioconductor)やpyOpenMS, MS-Dial等のフリーソフトウェアで読み込んでピーク抽出や、代謝物質の同定・定量を行えるようにすることが必須で、この際、フリーソフトウェアで使用される機能の拡張やパラメータ調整を行いながら、代謝物質同定や定量の精度の検証を行う。これに合わせて最終年度は高性能計算機器類を導入し、ソフトウェアの面からだけでなく、ハードウェアの面からもメタボロームデータの処理効率を飛躍的に向上させるべく計算環境を整備する。そして、本パイプラインを活用して共同研究機関である名古屋大学と腎臓病患者より得られた実際のメタボロームデータの解析を進め、大量の生データから腎臓病の発症または進行に関わる代謝物質に対応するピークの候補をこれまでより高い精度で大量に効率よく抽出できるか検証していく。一方で、「加工・整形」済メタボロームデータの処理に関しても、2023年度に開発したiDMETをより結果の解釈性に優れるように改良し(iDMET+)、最終的には生データの処理から外部データとの統合までを機能として備える「ソフトウェアスイート」を揃えたいと考えている。

報告書

(2件)

2023 実施状況報告書
2022 実施状況報告書

研究成果
(7件)

すべて 2023 2022 その他

すべて国際共同研究 (1件) 雑誌論文 (2件) (うち国際共著 1件、オープンアクセス 2件、査読あり 1件) 学会発表 (4件) (うち国際学会 1件、招待講演 1件)

[国際共同研究] The University of Texas at San Antonio(米国)
- 関連する報告書
  2023 実施状況報告書
[雑誌論文] SUPPRESION OF MITOCHONDRIAL RESPIRATION IS A FEATURE OF CELLULAR GLUCOSE TOXICITY2023
- 著者名/発表者名
  Sharma K, Zhang G, Saito R
- 雑誌名
  
  Trans Am Clin Climatol Assoc
  
  巻: 133 ページ: 24-33
- 関連する報告書
  2023 実施状況報告書
- オープンアクセス / 国際共著
[雑誌論文] iDMET: network-based approach for integrating differential analysis of cancer metabolomics2022
- 著者名/発表者名
  Matsuta Rira、Yamamoto Hiroyuki、Tomita Masaru、Saito Rintaro
- 雑誌名
  
  BMC Bioinformatics
  
  巻: 23 号: 1
- DOI
  10.1186/s12859-022-05068-0
- 関連する報告書
  2022 実施状況報告書
- 査読あり / オープンアクセス
[学会発表] iDMETによるがんメタボロームデータの統合解析2023
- 著者名/発表者名
  松田りら、山本博之、牧野嶋秀樹、曽我朋義、斎藤輪太郎
- 学会等名
  第17回メタボロームシンポジウム
- 関連する報告書
  2023 実施状況報告書
- 招待講演
[学会発表] iDMET: Network-Based Approach for Integrating Differential Analysis of Cancer Metabolomics2023
- 著者名/発表者名
  Rira Matsuta, Hiroyuki Yamamoto, Masaru Tomita, and Rintaro Saito
- 学会等名
  2023 13th International Conference on Bioscience, Biochemistry and Bioinformatics (ICBBB 2023)
- 関連する報告書
  2022 実施状況報告書
- 国際学会
[学会発表] 大規模メタボロームデータに含まれる未知ピークの信頼性評価2022
- 著者名/発表者名
  斎藤輪太郎、杉本昌弘、平山明由、曽我朋義、冨田勝、武林亨
- 学会等名
  第16回メタボロームシンポジウム in 鶴岡
- 関連する報告書
  2022 実施状況報告書
[学会発表] 大規模メタボロームデータに含まれる未知ピークの信頼性評価2022
- 著者名/発表者名
  斎藤輪太郎、杉本昌弘、平山明由、曽我朋義、冨田勝、武林亨
- 学会等名
  第42回キャピラリー電気泳動シンポジウム
- 関連する報告書
  2022 実施状況報告書

腎臓病メタボロームの統合データ解析パイプラインの構築

研究代表者

斎藤 輪太郎 慶應義塾大学, 政策・メディア研究科(藤沢), 特任教授 (40348842)

4,160千円 (直接経費: 3,200千円、間接経費: 960千円)

現在までの達成度 (区分)

理由

報告書

研究成果

[国際共同研究] The University of Texas at San Antonio(米国)

関連する報告書

[雑誌論文] SUPPRESION OF MITOCHONDRIAL RESPIRATION IS A FEATURE OF CELLULAR GLUCOSE TOXICITY2023

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] iDMET: network-based approach for integrating differential analysis of cancer metabolomics2022

著者名/発表者名

雑誌名

DOI

関連する報告書

[学会発表] iDMETによるがんメタボロームデータの統合解析2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] iDMET: Network-Based Approach for Integrating Differential Analysis of Cancer Metabolomics2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] 大規模メタボロームデータに含まれる未知ピークの信頼性評価2022

著者名/発表者名

学会等名

関連する報告書

[学会発表] 大規模メタボロームデータに含まれる未知ピークの信頼性評価2022

著者名/発表者名

学会等名

関連する報告書

斎藤輪太郎慶應義塾大学, 政策・メディア研究科(藤沢), 特任教授 (40348842)