研究課題/領域番号 |
22K08317
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分53040:腎臓内科学関連
|
研究機関 | 慶應義塾大学 |
研究代表者 |
斎藤 輪太郎 慶應義塾大学, 政策・メディア研究科(藤沢), 特任教授 (40348842)
|
研究分担者 |
安田 宜成 名古屋大学, 医学系研究科, 特任准教授 (60432259)
|
研究期間 (年度) |
2022-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2024年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2023年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2022年度: 2,470千円 (直接経費: 1,900千円、間接経費: 570千円)
|
キーワード | メタボローム / 腎臓病 / インフォマティクス / バイオインフォマティクス / ネットワーク / データ解析 / システム生物学 / ソフトウェア |
研究開始時の研究の概要 |
腎臓病患者の血液・尿等を分析して得られたメタボロームデータ(網羅的な代謝物質の情報)を公共データと効果的に統合し、解析するためのソフトウェアのパイプラインを構築する。すなわち、機械学習等AIの技術を利用して、腎臓病に関わる可能性の高い代謝物質を抽出するとともに、公共の腎臓組織中の酵素遺伝子発現データや分子間相互作用ネットワークとの統合解析・可視化を行い、メタボローム解析の結果解釈を加速するパイプラインを構築する。これによって従来よりも高精度でより多くの代謝物質の制御因子を予測し、腎臓病が進行する分子メカニズムの考察を深められるとともに、実験による検証のターゲットを提供できる。
|
研究実績の概要 |
2023年度はメタボローム生データの情報処理技術の開発を行った。本研究で主に使用されるメタボローム分析装置CE-TOFMSより得られる生データの容量は1サンプル当たり500MB~3GBにもなるため、解析するサンプル数が増えると、記憶装置の容量が圧迫されるとともに、代謝物質情報抽出のための精密な情報処理をする時間も大変長くなってしまうことが問題となっていた。 そこで、これら大量のメタボローム生データよりノイズと思われる部分を除去し、代謝物質に関する情報を含んでいると思われる部分(ROI, region of interest)を抽出する手法の開発を2つのアプローチから行った。1つは、データ中にはノイズしかない部分があるというCE-TOFMSの生データの特徴を生かし、この部分の統計学的特徴を解析し、それをもとに、それ以外のデータ部分の正規化を行って、ノイズにはない統計的特徴がある部分をROIとして特定する処理を行った。また、画像の機械学習等で用いられる「畳み込み」という手法を応用し、捉えた特徴をさらに浮き上がらせる処理を重ねた。その結果、通常の分析で対象としている代謝物質60種類 (陽イオン)に対応するデータ部分を全てROIとして抽出しつつ、データ容量を1/30~1/170に圧縮することができた。圧縮したデータは標準化された形式(mzML)に変換し、xcms等、広く用いられているメタボローム情報処理用フリーソフトウェアで扱えるようにした。 またこれと並行して、共同研究機関である名古屋大学と実際の腎臓病に関連したメタボロームの解析(長期間透析患者の血漿メタボロームプロファイルの解析等)を進めている。さらに、テキサス大学サンアントニオ校とも糖尿病性腎症の患者の尿中メタボロームの解析を行い、糖尿病性腎症の患者の腎臓細胞中のミトコンドリア内の分子ネットワークおよび機能低下について考察した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究課題では申請時点より3つの「柱」をもとにした研究計画を立てている。柱1は公開されているメタボロームデータを統合解析するための情報科学的手法の開発、柱2は機械学習の仕組みを実装しデータ処理の精度・効果を向上させること、柱3はメタボローム分析装置より直接得られるメタボローム生データの高度な情報処理である。 2022年度は柱1の一環として、既に「加工・整形」された表形式のメタボロームデータの解析方法の開発に力を入れ、iDMETという複数機関より得られた性質の異なるメタボロームデータを統合解析する手法を開発・公表する等、一定の成果を挙げることができた。2023年度は柱2と3の一環として「加工・整形」前の「生データ」を解析の対象とし、機械学習の技術も利用しつつ、コホート研究から得られるような大量のメタボロームの生データでも現実的な時間内で効率良く処理するためのソフトウェアの開発に注力した。 ここで、研究計画と照らし合わせて重要となった達成必須項目は(1) 誰でも使用・改良ができるようなフリーソフトウェアを用いたパイプラインを構築すること、(2) 大規模メタボロームデータの容量を大幅に削減し、大容量ポータブルハードディスクドライブ数個でも1万人規模のデータを扱えるようにすること、である。後者の(2)については、CE-TOFMSの生データからノイズである可能性が高い領域を除去することによってデータ容量を1/30~1/170に圧縮できる手法を開発し、また(1)に対応すべく、圧縮済のデータをフリーソフトウェアで扱えるように標準形式に変換できる機能を組み込んだ。 このような手法の開発と並行して、腎臓病患者より得られた実際のメタボロームデータの解析を分担研究機関である名古屋大学や新規共同研究機関であるテキサス大学サンアントニオ校と進めており、当初の計画に沿って研究が着実に進んでいると考えている。
|
今後の研究の推進方策 |
2023年度までにメタボロームの生データ処理手法の開発、複数機関由来の「加工・整形」済メタボロームデータの統合技術の開発(iDMET)、実際の腎臓患者由来の検体のメタボロームプロファイル解析等、計画した項目を一通りなぞることができた。最終年度は2023年度に開発したメタボローム生データ処理手法とフリーソフトウェアを組み合わせ、メタボロームデータ処理の各段階(ROI抽出によるデータ削減、ROIからの代謝物質に対応する波形パターン「ピーク」の抽出、代謝物質同定、定量等)を自動的に進めるようなソフトウェアパイプラインの構築を進める。 そのためにまず、生データ処理手法によって得られた縮小データをxcms (Bioconductor)やpyOpenMS, MS-Dial等のフリーソフトウェアで読み込んでピーク抽出や、代謝物質の同定・定量を行えるようにすることが必須で、この際、フリーソフトウェアで使用される機能の拡張やパラメータ調整を行いながら、代謝物質同定や定量の精度の検証を行う。 これに合わせて最終年度は高性能計算機器類を導入し、ソフトウェアの面からだけでなく、ハードウェアの面からもメタボロームデータの処理効率を飛躍的に向上させるべく計算環境を整備する。 そして、本パイプラインを活用して共同研究機関である名古屋大学と腎臓病患者より得られた実際のメタボロームデータの解析を進め、大量の生データから腎臓病の発症または進行に関わる代謝物質に対応するピークの候補をこれまでより高い精度で大量に効率よく抽出できるか検証していく。 一方で、「加工・整形」済メタボロームデータの処理に関しても、2023年度に開発したiDMETをより結果の解釈性に優れるように改良し(iDMET+)、最終的には生データの処理から外部データとの統合までを機能として備える「ソフトウェアスイート」を揃えたいと考えている。
|