研究課題/領域番号 |
22K08317
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分53040:腎臓内科学関連
|
研究機関 | 慶應義塾大学 |
研究代表者 |
斎藤 輪太郎 慶應義塾大学, 政策・メディア研究科(藤沢), 特任教授 (40348842)
|
研究分担者 |
安田 宜成 名古屋大学, 医学系研究科, 特任准教授 (60432259)
|
研究期間 (年度) |
2022-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2024年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2023年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2022年度: 2,470千円 (直接経費: 1,900千円、間接経費: 570千円)
|
キーワード | メタボローム / バイオインフォマティクス / ネットワーク / データ解析 / システム生物学 / ソフトウェア / 腎臓病 |
研究開始時の研究の概要 |
腎臓病患者の血液・尿等を分析して得られたメタボロームデータ(網羅的な代謝物質の情報)を公共データと効果的に統合し、解析するためのソフトウェアのパイプラインを構築する。すなわち、機械学習等AIの技術を利用して、腎臓病に関わる可能性の高い代謝物質を抽出するとともに、公共の腎臓組織中の酵素遺伝子発現データや分子間相互作用ネットワークとの統合解析・可視化を行い、メタボローム解析の結果解釈を加速するパイプラインを構築する。これによって従来よりも高精度でより多くの代謝物質の制御因子を予測し、腎臓病が進行する分子メカニズムの考察を深められるとともに、実験による検証のターゲットを提供できる。
|
研究実績の概要 |
2022年度は「自前」で取得したデータを公共メタボロームデータと統合解析する手法(iDMETと命名)の開発に力を注いだ。メタボローム解析は今や世界中の研究機関で進められており、論文が掲載されているウェブサイトやMetaboLights、Metabolomics Workbench等のリポジトリに取得されたメタボロームデータが公開されている。これらのデータを統合的に利用すれば、個々のメタボローム測定だけでは見えてこなかった知見が得られる可能性がある。 しかしながら、一般的に、メタボローム分析をするための装置や条件は研究機関毎に独自開発・設置・設定が進められ、測定対象となる代謝物質群の共通性は低く、また代謝物質の絶対定量値の統計的性質も大きく異なる。そして分析結果のうち、公開されているデータがしばしば限定されることもあり、従来は異なる研究機関より得られた複数のメタボロームデータを統合解析することは困難であった。 iDMETは一つの研究機関より得られた2つの条件下における対となるメタボローム絶対定量値について、比を計算し、「相対値プロファイル」に変換することによって、研究機関の間の定量値の性質の相違を緩和する。 また、複数のメタボロームデータを「表形式」で統合(マージ)するのではなく、相対値プロファイルのペアの集合としてネットワークを形成する。これにより、統合するメタボロームデータの由来となる研究機関の数が多くなると、共通して測定されている代謝物質の数が激減するという問題を回避する。 実際に、iDMETは27個の論文・公共リポジトリのエントリーから得られた異質な癌メタボロームデータを統合し、PKI-587とM4Nという異なる2つの薬剤が実は同じ代謝経路を制御している可能性が示唆される等、今まで見えなかった生命現象間の相関が見えるようになった。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究では、メタボロームデータから多くの医学的・分子生物学的価値を引き出すべく、公共データを最大限に活用し、単に代謝物質量の統計解析を行うのみならず、代謝物質が関わると予測される新規分子制御ネットワークを情報科学的に抽出することを目標とし、そのためのソフトウェアのパイプラインの構築を行っている。 具体的には、本研究課題提案時に、以下の3つの柱をパイプラインで統合し、その相乗効果によって、メタボロームデータの価値を高め、腎臓疾患等に関わる因子群の高精度な抽出の加速を目指した。柱1は公開されているメタボロームデータを統合解析するための情報科学的手法の開発、柱2は機械学習の仕組みを実装しデータ処理の精度・効果を向上させること、柱3はメタボローム分析装置より直接得られるメタボローム生データの高度な情報処理である。 本研究課題の期間3年の中で、2022年度は3つの柱のうち柱1に注力し、バイオインフォマティクスや統計的手法を駆使しつつ、公開されたメタボロームデータを効果的に統合する手法iDMETの開発を行った。iDMETの妥当性は同一の腎臓疾患(腎淡明細胞癌)に関わる2つの測定データを関連が強いペアとして自動的に特定したことで示された。また、iDMETによる解析結果から代謝制御経路に関する新たな仮説(2種類の異なる薬剤が実は類似した代謝経路を制御している可能性)を立てることができたことから、その有効性も示唆された。 iDMETはソフトウェアの公共リポジトリgithubに公開され(https://github.com/riramatsuta/iDMET)、また今年度これらの成果を論文発表するに至ったため(Matsuta R, Yamamoto H, Tomita M, Saito R. BMC Bioinformatics 2023)、本研究課題は順調に進んでいると考えている。
|
今後の研究の推進方策 |
当初の計画に沿う次のステップとして、柱3のメタボローム分析装置より直接得られるメタボローム生データの高度な情報処理技術の開発を進める。例えば当研究所が独自開発したメタボローム分析装置CE-MSより得られるメタボローム生データは1サンプル辺り1Gバイトにもなるが、データのどの部分がどの既知の代謝物質に対応するかが推定できるのは一般的に全データの1%未満であり、残りの99%以上の部分は解釈不能な部分として捨てられてしまう。当研究所では、この捨てられてしまう部分、すなわち未知ピークの中にも実は腎臓病患者に特有のパターンを示す部分があることを突き止めており、また研究代表者が以前機械学習を用いて行った解析でも、尿サンプルより検出された特定の未知ピークの大きさが急性腎障害罹患リスクを予測する上で有効な変数として自動抽出されている(Saito R et al. Metabolites 2021)。さらに代表者は、データのシグナルの強さや再現性、サンプルを希釈した時のシグナルの定量性などから、代謝物質に対応する部分を情報科学的に抽出する方法を開発した(Saito R et al. J Clin Med. 2021)。腎臓病患者等特定の疾患を持つ患者の血液や尿から得られるメタボローム生データにこの手法をカスタマイズして実行すれば、標準的な方法以上に腎臓患者に特有のメタボロームのパターンを抽出できることが期待される。 一方、2022年度のiDMETの研究成果を受けて、収集したメタボロームデータの高度なデータベース化・システム化が課題として挙げられた。すなわち、収集したメタボロームデータのデータ構造をしっかりと定義し、SQLiteやMySQL等のデータベースに取り込み、これを利用するするためのAPI・ビューを開発してデータの再利用性を向上させ、iDMETの研究をさらに発展させることを検討している。
|