本研究は、電子カルテのテキストデータを活用し、診療録の記述に基づいて疾患名の診断支援を行うAI構築を目指すものである。 2020年度に確立した「症例マトリクス」の構築手法に基づいて、2021年度は、この症例マトリクスを学習データとして病名を予測する機械学習モデルの構築に注力した。さらに、症例マトリクスを別の疾患に適用することにも成功し、本手法の有用性、汎用性が示された。2022年度、2023年度は本モデルの精度向上に加え、症例マトリクスの汎用性実証のために、類似症例予測モデルの構築を行なった。 病名予測モデルについては、循環器系の疾患を対象として、主訴、既往歴などのテキスト記述から一定の精度で病名を予測可能な機械学習モデルが得られ、本研究のアプローチの有用性が示されたとともに、病名予測におけるテキストデータの有効性、重要性が示されたと考える。 加えて、類似症例予測モデルでは、症例マトリクスの中から、主訴や既往歴などに含まれる単語の出現パターンに基づいて類似症例を探索する教師なしの機械学習モデルを構築し、ある症例を入力としたときに、一定の検出精度で、類似症例を提示するモデル構築に成功した。また、本モデルは、類似症例と判定された症例における一致単語を一覧化して表示する機能も兼ね揃え、どのような観点で類似症例と判定されたか解釈可能な説明性の高い類似症例予測モデルを得た。 これにより、本研究の意義ならびに、症例マトリクスの汎用性、有用性が大いに示されたと考える。
|