研究課題
慢性腎臓病(CKD)患者の正確な予後予測は、病態解明において重要な課題である。大量の医学文献データと大規模患者データを最新の人工知能(AI)と数理学的手法を用いた解析でバーチャル空間内にCKD病態ネットワークを構築し、CKDの病態を解明することを目的として研究に着手した。成果(1)CKD患者の予後予測システムの開発・実装:アウトカム(末期腎不全または死亡)の発生を予測するため、Random ForestやeXtreme Gradient Boosting (XBG)などを用いた機械学習モデルを26種類開発した。最も予測能が高いモデルをサーバに搭載し、予後予測WEBシステムの実装に成功した(Kanda E. PLOS Digit Health)。成果(2) 合併症のあるCKD患者の予後:(2-1) 高K血症患者の予後予測;高カリウム血症エピソード後の死亡、透析および心血管イベントを予測するXGBモデルを開発した(Kanda E. Nutrients)。(2-2) 2型糖尿病患者の予後予測:2型糖尿病患者を対象に、糖尿病性腎症または心不全の発症を予測するXGBモデルを作成した。SHAP解析により危険因子を発見した(Kanda E. Sci Rep)。成果(3) 医学用語バーチャル空間の構造の解明:CKDに関する文献を自然言語処理AIにより構築した医学用語バーチャル空間はリーマン多様体を構成した。さらに空間内のCKD関連因子間の関係(多様体的距離)はアウトカム発生に相関した。この結果は第65回日本腎臓学会学術総会にて優秀演題賞を受賞し、米国応用数学会でニュースとして取り上げられた(SIAM News)。これらの成果によって、患者データおよび医学テキストデータのベクトル化を基盤としたCKDの病態ネットワーク構築の医学的意義が示された。今後は、このネットワークの開発を目指す。
2: おおむね順調に進展している
CKD患者データを基盤とした3つの機械学習モデルの開発を通して、末期腎不全、死亡、心血管疾患、糖尿病性腎症の発症などの様々なアウトカムイベントの発生を、AIが正確に予測できることを示した。また、CKDだけでなく糖尿病や高K血症などを合併した患者を対象にしても高精度な予測が可能なことが示された。さらに、SHAP解析や重要度分析によって、臨床上重要なアウトカムの危険因子を発見することができた。以上の結果から、機械学習モデルによる予測確率がCKD治療の新しい普遍的治療指標となりうることが示された。また、機会学習モデルが病態を数理学的に表すことも明らかになった。さらに、CKD患者の予後予測WEBシステムを開発・実装した。このシステムの活用により、外来での迅速な予後予測と治療方針の決定が可能になる。また開発の際に、WEBサーバー構築、ネットワーク通信、クライアントGraphical User Interfaceなどの新規技術を用いたことにより、医療AIの研究開発から実装に至るまでの戦略と課題が明確になった。社会実装には、ランニングコストやユーザのデータサイエンスリテラシーなどの問題点に対応する必要がある。医学文献をAIで解析したところ、リーマン多様体を形成する医学用語バーチャル空間の構築に成功した。その空間内のCKD関連因子間のリーマン多様体的距離がアウトカムのサロゲートマーカーとなりうることが分かった。これによりCKD関連因子のネットワークがCKDの病態概念を数理学的に表出することが示唆された。これらの解析結果から、機械学習モデルによって、患者データや医学的概念を反映するデータ空間を構築できることが示された。以上より、おおむね順調に進展していると言える。
これまでの機械学習モデルの開発で、CKD患者のアウトカム発生を高精度に予測することが可能であることが分かった。これにより、機械学習モデルによってアウトカムとその関連因子をデータ空間上に紐づけることができた。つまり、AIによって患者データをデータ空間内にモデル化できることが示された。今後は、CKD患者のビッグデータを活用し、精緻なモデルの開発を目指す。次に、医学用語バーチャル空間の構築により、CKDと関連因子からなる医学用語ネットワークが構成されることが分かった。医学用語バーチャル空間内のCKD関連因子間の関係性を、医学的見地および数理学的理論に基づいて検証する。以上から、CKDの病態を表すネットワークが、患者データ空間と医学用語バーチャル空間を結びつけることにより構築されることが示唆された。そこで、まず、この医学用語バーチャル空間が患者データ空間と医学的・数理学的に対応していることを示す。次に、患者データ空間と医学用語バーチャル空間を統合したネットワークを構築する。そして、このネットワークの実用化に向けシステム開発を推進する。
本研究では医学テキストデータおよび患者ビッグデータを解析する必要がある。そのためには、高速のCPUとGPU、大容量のメモリとハードディスクを装備したコンピュータを準備する必要があった。また、Windows 11に合わせてソフトウェアを更新しなければならなかった。しかしながら、目標とするスペックのコンピュータは、今年度の予算を大幅にオーバーしてしまうため今年度は購入できず、次年度使用額が生じた。次年度は、CKD患者の解析用データベースを作成し、解析を開始する。そのため、PC周辺機器、統計解析ソフトなど解析に必要な物品の購入を検討する。また、学会発表や論文の執筆も行う予定である。
すべて 2023 2022 その他
すべて 雑誌論文 (8件) (うち国際共著 3件、 査読あり 8件、 オープンアクセス 8件) 学会発表 (13件) (うち国際学会 5件、 招待講演 7件) 図書 (1件) 備考 (1件)
PLOS Digital Health
巻: 2 ページ: e0000188
10.1371/journal.pdig.0000188
Scientific Reports
巻: 12 ページ: 20012
10.1038/s41598-022-24562-2
Nutrients
巻: 14 ページ: 4614~4614
10.3390/nu14214614
Journal of Bone and Mineral Research
巻: 37 ページ: 1489~1499
10.1002/jbmr.4621
Journal of Nutritional Science and Vitaminology
巻: 68 ページ: S76~S77
10.3177/jnsv.68.S76
ESC Heart Failure
巻: 9 ページ: 1138~1151
10.1002/ehf2.13784
Kidney International Reports
巻: 7 ページ: 2059~2070
10.1016/j.ekir.2022.05.033
PLOS ONE
巻: 17 ページ: e0265272
10.1371/journal.pone.0265272
https://sinews.siam.org/Details-Page/new-surrogate-marker-of-chronic-kidney-disease-progression-and-mortality-in-medical-word-virtual-space