• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2022 年度 実施状況報告書

腎臓病メタボロームの統合データ解析パイプラインの構築

研究課題

研究課題/領域番号 22K08317
研究機関慶應義塾大学

研究代表者

斎藤 輪太郎  慶應義塾大学, 政策・メディア研究科(藤沢), 特任教授 (40348842)

研究分担者 安田 宜成  名古屋大学, 医学系研究科, 特任准教授 (60432259)
研究期間 (年度) 2022-04-01 – 2025-03-31
キーワードメタボローム / バイオインフォマティクス / ネットワーク
研究実績の概要

2022年度は「自前」で取得したデータを公共メタボロームデータと統合解析する手法(iDMETと命名)の開発に力を注いだ。メタボローム解析は今や世界中の研究機関で進められており、論文が掲載されているウェブサイトやMetaboLights、Metabolomics Workbench等のリポジトリに取得されたメタボロームデータが公開されている。これらのデータを統合的に利用すれば、個々のメタボローム測定だけでは見えてこなかった知見が得られる可能性がある。
しかしながら、一般的に、メタボローム分析をするための装置や条件は研究機関毎に独自開発・設置・設定が進められ、測定対象となる代謝物質群の共通性は低く、また代謝物質の絶対定量値の統計的性質も大きく異なる。そして分析結果のうち、公開されているデータがしばしば限定されることもあり、従来は異なる研究機関より得られた複数のメタボロームデータを統合解析することは困難であった。
iDMETは一つの研究機関より得られた2つの条件下における対となるメタボローム絶対定量値について、比を計算し、「相対値プロファイル」に変換することによって、研究機関の間の定量値の性質の相違を緩和する。
また、複数のメタボロームデータを「表形式」で統合(マージ)するのではなく、相対値プロファイルのペアの集合としてネットワークを形成する。これにより、統合するメタボロームデータの由来となる研究機関の数が多くなると、共通して測定されている代謝物質の数が激減するという問題を回避する。
実際に、iDMETは27個の論文・公共リポジトリのエントリーから得られた異質な癌メタボロームデータを統合し、PKI-587とM4Nという異なる2つの薬剤が実は同じ代謝経路を制御している可能性が示唆される等、今まで見えなかった生命現象間の相関が見えるようになった。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

本研究では、メタボロームデータから多くの医学的・分子生物学的価値を引き出すべく、公共データを最大限に活用し、単に代謝物質量の統計解析を行うのみならず、代謝物質が関わると予測される新規分子制御ネットワークを情報科学的に抽出することを目標とし、そのためのソフトウェアのパイプラインの構築を行っている。
具体的には、本研究課題提案時に、以下の3つの柱をパイプラインで統合し、その相乗効果によって、メタボロームデータの価値を高め、腎臓疾患等に関わる因子群の高精度な抽出の加速を目指した。柱1は公開されているメタボロームデータを統合解析するための情報科学的手法の開発、柱2は機械学習の仕組みを実装しデータ処理の精度・効果を向上させること、柱3はメタボローム分析装置より直接得られるメタボローム生データの高度な情報処理である。
本研究課題の期間3年の中で、2022年度は3つの柱のうち柱1に注力し、バイオインフォマティクスや統計的手法を駆使しつつ、公開されたメタボロームデータを効果的に統合する手法iDMETの開発を行った。iDMETの妥当性は同一の腎臓疾患(腎淡明細胞癌)に関わる2つの測定データを関連が強いペアとして自動的に特定したことで示された。また、iDMETによる解析結果から代謝制御経路に関する新たな仮説(2種類の異なる薬剤が実は類似した代謝経路を制御している可能性)を立てることができたことから、その有効性も示唆された。
iDMETはソフトウェアの公共リポジトリgithubに公開され(https://github.com/riramatsuta/iDMET)、また今年度これらの成果を論文発表するに至ったため(Matsuta R, Yamamoto H, Tomita M, Saito R. BMC Bioinformatics 2023)、本研究課題は順調に進んでいると考えている。

今後の研究の推進方策

当初の計画に沿う次のステップとして、柱3のメタボローム分析装置より直接得られるメタボローム生データの高度な情報処理技術の開発を進める。例えば当研究所が独自開発したメタボローム分析装置CE-MSより得られるメタボローム生データは1サンプル辺り1Gバイトにもなるが、データのどの部分がどの既知の代謝物質に対応するかが推定できるのは一般的に全データの1%未満であり、残りの99%以上の部分は解釈不能な部分として捨てられてしまう。当研究所では、この捨てられてしまう部分、すなわち未知ピークの中にも実は腎臓病患者に特有のパターンを示す部分があることを突き止めており、また研究代表者が以前機械学習を用いて行った解析でも、尿サンプルより検出された特定の未知ピークの大きさが急性腎障害罹患リスクを予測する上で有効な変数として自動抽出されている(Saito R et al. Metabolites 2021)。さらに代表者は、データのシグナルの強さや再現性、サンプルを希釈した時のシグナルの定量性などから、代謝物質に対応する部分を情報科学的に抽出する方法を開発した(Saito R et al. J Clin Med. 2021)。腎臓病患者等特定の疾患を持つ患者の血液や尿から得られるメタボローム生データにこの手法をカスタマイズして実行すれば、標準的な方法以上に腎臓患者に特有のメタボロームのパターンを抽出できることが期待される。
一方、2022年度のiDMETの研究成果を受けて、収集したメタボロームデータの高度なデータベース化・システム化が課題として挙げられた。すなわち、収集したメタボロームデータのデータ構造をしっかりと定義し、SQLiteやMySQL等のデータベースに取り込み、これを利用するするためのAPI・ビューを開発してデータの再利用性を向上させ、iDMETの研究をさらに発展させることを検討している。

次年度使用額が生じた理由

ソフトウェアのパイプラインが概ね完成してから、高性能な計算機器類を購入し、パイプラインをインストールして大容量のデータを高速に解析する予定。

  • 研究成果

    (4件)

すべて 2023 2022

すべて 雑誌論文 (1件) (うち査読あり 1件、 オープンアクセス 1件) 学会発表 (3件) (うち国際学会 1件)

  • [雑誌論文] iDMET: network-based approach for integrating differential analysis of cancer metabolomics2022

    • 著者名/発表者名
      Matsuta Rira、Yamamoto Hiroyuki、Tomita Masaru、Saito Rintaro
    • 雑誌名

      BMC Bioinformatics

      巻: 23 ページ: -

    • DOI

      10.1186/s12859-022-05068-0

    • 査読あり / オープンアクセス
  • [学会発表] iDMET: Network-Based Approach for Integrating Differential Analysis of Cancer Metabolomics2023

    • 著者名/発表者名
      Rira Matsuta, Hiroyuki Yamamoto, Masaru Tomita, and Rintaro Saito
    • 学会等名
      2023 13th International Conference on Bioscience, Biochemistry and Bioinformatics (ICBBB 2023)
    • 国際学会
  • [学会発表] 大規模メタボロームデータに含まれる未知ピークの信頼性評価2022

    • 著者名/発表者名
      斎藤 輪太郎、杉本 昌弘、平山 明由、曽我 朋義、冨田 勝、武林 亨
    • 学会等名
      第16回メタボロームシンポジウム in 鶴岡
  • [学会発表] 大規模メタボロームデータに含まれる未知ピークの信頼性評価2022

    • 著者名/発表者名
      斎藤 輪太郎、杉本 昌弘、平山 明由、曽我 朋義、冨田 勝、武林 亨
    • 学会等名
      第42回キャピラリー電気泳動シンポジウム

URL: 

公開日: 2023-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi