研究実績の概要 |
阪大病院他、4施設にレセプト・DPCデータ、検体検査結果に合わせて、画像診断レポートを格納する多施設共通DBを設置し、本研究で構築した固有表現抽出AI、確信度判定AI、関係抽出AIを適応し、構造化データをJSON形式で出力することを実施した。 臨床応用として、構造化された画像診断レポートからがん所見が含まれるレポートを抽出するプログラムを構築し、その評価を行った。最初に機械学習により抽出した17.033個の用語から2回以上出現した用語7.051語に対し、腫瘍に対するフラグを立て、腫瘍に対して、良性、悪性、判断できない、のフラグを付与した。悪性、判断できない、フラグの立ったレポートのうち、臨床所見に良性所見が付与されているもの、サイズ変化が改善、変化なしのものを除く所見を重要所見と判定した。がん登録ベースの評価セットではSensitivityが95.10%、PPVが96.09%で予想が可能であった。実臨床ベースの評価セットでは、PPVが73.78%に低下した。阪大病院の12,539件の画像診断レポートに対し、がん所見のkeywordマッチと本プログラムを比較した。keywordマッチでは2,331件(18.6%)でがん所見が疑われ、「〇〇癌術後」、「転移は認めない」などの誤検出や「RCC・AIS・播種」といったKeywordに含まれない検出漏れが確認された。本プログラムでは1,288件(10.3%)で、偽陽性はno_sign_of_metastasisを陽性と判定した1例のみであった。 前年度構築した胸部CTで肺尖部、気管分岐部、横隔膜直上部を判定する機械学習モデルを用いて上肺野、中肺野、下肺野の胸部CT代表画像を抽出した。これらの画像を用いて間質性肺炎の進行を予測する機械学習モデルを構築し、AUROC:0.799で進行性間質性肺炎を予測することに成功した。
|