研究課題/領域番号 |
20K09171
|
研究機関 | 東京医科大学 |
研究代表者 |
梶原 直央 東京医科大学, 医学部, 教授 (70343514)
|
研究分担者 |
杉本 昌弘 東京医科大学, 医学部, 教授 (30458963)
池田 徳彦 東京医科大学, 医学部, 主任教授 (70246205)
垣花 昌俊 東京医科大学, 医学部, 講師 (90366112)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
キーワード | 人工知能 / メタボローム解析 |
研究実績の概要 |
肺癌において単一マーカーあるいは数個のマーカーの組み合わせだけでの病態評価や治療効果予測には限界があり、より多くの生体情報を活用して個々の病態を個別に評価できる指標開発が必要である。特に肺癌の術後補助および再発・転移治療の決定には、癌の多様性を正確に評価した個々の特徴と治療方針が重要となる。本研究では、組織検体と低侵襲に採取可能な体液(血液等)で見られる代謝異常をメタボローム解析して網羅的に調べる。つまり、肺癌患者に特異的な代謝変化をプロファイリングし、機械学習(人工知能)によりそのパターンの解析を行う。遺伝子変異や画像情報などから集約した臨床情報も加味して統合的な疾患評価の数理モデルの開発を行い、人工知能とメタボローム解析を用いた肺癌の新規診断方法の開発を目的とする。 肺癌患者に特異的な代謝変化をプロファイリングし、機械学習(人工知能)によりそのパターンの解析を行い、臨床情報も加味して統合的な疾患評価の数理モデルの開発を行うことで、人工知能とメタボローム解析を用いた肺癌の新規診断方法の開発を行っていく。肺癌を早期に検出し、プレシジョン・メディシンによる効果とその先の予後の改善により、将来的に必要な治療方針を導き出す「先回り医療」のための一連のシステムを確立する事になる。これは疾病予防や最適な治療法を確立し得るシステムであり、日本の保険医療における費用対効果において莫大な費用削減が期待される。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
これまでにメタボロームの測定定量データを用いて、疾患部位と非疾患部位の違いを、単独分子の統計だけでなく複数分子の変化の傾向をえるためにPathway解析を実施した。解糖系の更新や、アミノ酸代謝の変化など、既存の研究と一致する傾向を確認しつつ、報告のない代謝物も含んでマーカーの候補となる物質を絞り込んだ。また、Java言語で記載された機械学習のライブラリwekaを導入し、Python言語からこのライブラリを呼び出せる仕組みを構築し、機械学習のプログラムを、オプションを変えながら連続的に動かせる仕組みとした。データをランダムに分割してモデルの学習と評価を行うクロスバリデーションを実施しつつ、モデルのオプションを網羅的に変えて、複数分子の組み合わせモデルの学習と評価を実施した。多重ロジスティック回帰モデルと決定木を複数組み合わせた方法にて本手法の実装と試験を実施した。
|
今後の研究の推進方策 |
本研究では、以下のステップで研究を進める。 A)メタボロームのノンターゲット解析を確立する。生体中の濃度とMSのシグナルの直線性が得られるデータをノンターゲットで解析し、高定量性のピークを選別する。標品と一致するピークは絶対定量し、残りは相対定量する。かつ、検体の保存性の評価や、測定前処理の最適化により再現性の高い検体の保存方法を標準化(SOP)し、今後の検体採取・解析のプロトコルを確定する。個人差の影響を排除するために同一症例から腫瘍部と非腫瘍部のメタボローム解析を実施し、差を算出する。腫瘍部は既知の遺伝子情報(ALK, EGFR, K-ras, Her-2など)を調べ、これらの情報を統合しつつPathway解析等を行う。同一症例から治療前と手術後の血液検体を採取し、更に非癌症例からも血液検体を採取し、それぞれ比較にてマーカーの候補を選別し、整合性が取れる物質を選別する。 B) 機械学習(ニューラルネットワーク[ANN]やサポートベクターマシン[SVM]等を想定)を用いて多次元情報を最大限活用して予測が行える数理モデルを開発する。集団学習や強化学習も組み合わせて、過学習を防ぎつつ高精度な予測ができる手法を活用する。このような指標と臨床情報も含めた数理モデルも開発する。代謝物が単体でなくPathwayレベルでの変化が見られる場合はANNの一部を代謝物でなくPathwayの変化を扱えるように情報を抽象化して数理モデルに取り込む工夫も行う。 C)クロスバリデーションのような評価試験だけ(内部評価)でなく、独立して採取した検体及び測定データを用いた外部評価も行い、精度検証をする。実用化(簡易測定系の開発)を見据えてマーカー数を減らした精度検証や、サブタイプごとのモデル開発など追加解析を行う。
|
次年度使用額が生じた理由 |
機械学習の環境構築やプログラムには既存の計算マシンを利用し、試験的なデータも過去に測定したデータを用いたため、予算の使用が計画よりも小さい額で済んだ。一方今後、機械学習で得られた予測モデルの評価試験など多くの検体の測定が必要となるために、今後は消耗品の使用が大きくなる。
|