研究課題/領域番号 |
22K08346
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分53040:腎臓内科学関連
|
研究機関 | 川崎医科大学 |
研究代表者 |
神田 英一郎 川崎医科大学, 医学部, 教授 (40401377)
|
研究期間 (年度) |
2022-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2024年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2023年度: 520千円 (直接経費: 400千円、間接経費: 120千円)
2022年度: 2,990千円 (直接経費: 2,300千円、間接経費: 690千円)
|
キーワード | 慢性腎臓病 / 末期腎不全 / 人工知能 / ネットワーク / ビッグデータ / 深層学習 / 自然言語処理 / リーマン多様体 / AI / 圏論 |
研究開始時の研究の概要 |
慢性腎臓病(CKD)患者の腎生命予後を正確に予測する数理学的モデルの開発は、病態解明と治療法開発に役立つ重要な課題である。私共はCKD患者の大規模データベースをAIで解析し、腎・生命予後予測システムを開発してきた。そこで本研究では、医学文献を基盤としてCKDの病態概念のバーチャル空間を機械学習で構築し、CKD患者のデータベースと統合する。その結果構築されたCKD病態ネットワークを用いて、新規の病態因子と治療標的を開発する。
|
研究実績の概要 |
慢性腎臓病(CKD)患者の正確な予後予測は、病態解明において重要な課題である。大量の医学文献データと大規模患者データを最新の人工知能(AI)と数理学的手法を用いた解析でバーチャル空間内にCKD病態ネットワークを構築し、CKDの病態を解明することを目的として研究に着手した。 成果(1)CKD患者の予後予測システムの開発・実装:アウトカム(末期腎不全または死亡)の発生を予測するため、Random ForestやeXtreme Gradient Boosting (XBG)などを用いた機械学習モデルを26種類開発した。最も予測能が高いモデルをサーバに搭載し、予後予測WEBシステムの実装に成功した(Kanda E. PLOS Digit Health)。 成果(2) 合併症のあるCKD患者の予後:(2-1) 高K血症患者の予後予測;高カリウム血症エピソード後の死亡、透析および心血管イベントを予測するXGBモデルを開発した(Kanda E. Nutrients)。 (2-2) 2型糖尿病患者の予後予測:2型糖尿病患者を対象に、糖尿病性腎症または心不全の発症を予測するXGBモデルを作成した。SHAP解析により危険因子を発見した(Kanda E. Sci Rep)。 成果(3) 医学用語バーチャル空間の構造の解明:CKDに関する文献を自然言語処理AIにより構築した医学用語バーチャル空間はリーマン多様体を構成した。さらに空間内のCKD関連因子間の関係(多様体的距離)はアウトカム発生に相関した。この結果は第65回日本腎臓学会学術総会にて優秀演題賞を受賞し、米国応用数学会でニュースとして取り上げられた(SIAM News)。 これらの成果によって、患者データおよび医学テキストデータのベクトル化を基盤としたCKDの病態ネットワーク構築の医学的意義が示された。今後は、このネットワークの開発を目指す。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
CKD患者データを基盤とした3つの機械学習モデルの開発を通して、末期腎不全、死亡、心血管疾患、糖尿病性腎症の発症などの様々なアウトカムイベントの発生を、AIが正確に予測できることを示した。また、CKDだけでなく糖尿病や高K血症などを合併した患者を対象にしても高精度な予測が可能なことが示された。さらに、SHAP解析や重要度分析によって、臨床上重要なアウトカムの危険因子を発見することができた。以上の結果から、機械学習モデルによる予測確率がCKD治療の新しい普遍的治療指標となりうることが示された。また、機会学習モデルが病態を数理学的に表すことも明らかになった。 さらに、CKD患者の予後予測WEBシステムを開発・実装した。このシステムの活用により、外来での迅速な予後予測と治療方針の決定が可能になる。また開発の際に、WEBサーバー構築、ネットワーク通信、クライアントGraphical User Interfaceなどの新規技術を用いたことにより、医療AIの研究開発から実装に至るまでの戦略と課題が明確になった。社会実装には、ランニングコストやユーザのデータサイエンスリテラシーなどの問題点に対応する必要がある。 医学文献をAIで解析したところ、リーマン多様体を形成する医学用語バーチャル空間の構築に成功した。その空間内のCKD関連因子間のリーマン多様体的距離がアウトカムのサロゲートマーカーとなりうることが分かった。これによりCKD関連因子のネットワークがCKDの病態概念を数理学的に表出することが示唆された。 これらの解析結果から、機械学習モデルによって、患者データや医学的概念を反映するデータ空間を構築できることが示された。以上より、おおむね順調に進展していると言える。
|
今後の研究の推進方策 |
これまでの機械学習モデルの開発で、CKD患者のアウトカム発生を高精度に予測することが可能であることが分かった。これにより、機械学習モデルによってアウトカムとその関連因子をデータ空間上に紐づけることができた。つまり、AIによって患者データをデータ空間内にモデル化できることが示された。今後は、CKD患者のビッグデータを活用し、精緻なモデルの開発を目指す。 次に、医学用語バーチャル空間の構築により、CKDと関連因子からなる医学用語ネットワークが構成されることが分かった。医学用語バーチャル空間内のCKD関連因子間の関係性を、医学的見地および数理学的理論に基づいて検証する。 以上から、CKDの病態を表すネットワークが、患者データ空間と医学用語バーチャル空間を結びつけることにより構築されることが示唆された。そこで、まず、この医学用語バーチャル空間が患者データ空間と医学的・数理学的に対応していることを示す。次に、患者データ空間と医学用語バーチャル空間を統合したネットワークを構築する。そして、このネットワークの実用化に向けシステム開発を推進する。
|