研究実績の概要 |
胸部X線画像のデータセットであるMIMIC-CXR並びにJMIDを対象として、T5モデルを4種類構築した。定量評価指標としてROUGEスコアを用い、画像診断レポートの要約に関する性能を評価し最も性能の高いモデルを抽出した。また、自動要約されたレポート文の一部について、画像診断医による定性評価を実施した結果、得られたレポート文のうち85-86%が臨床的に有用であると考えられた(Nishio他)。 NTCIR-17のshared taskとして実施された、肺癌を対象とした画像診断レポートからTNM分類を推定するという課題に対して、(1)ChatGPTおよびLangChainを用いたプロンプトエンジニアリングによるzero-shot分類を実施し、T, N, M 各々についてaccuracyが各々 0.3951, 0.8025, 0.9259という結果を得た(Nishio他)。(2)openCALM-7B並びに独自に作成した肺癌のステージングに関するextended QAデータセットを用いて、オンプレミスでfine tuningを実施し、T, N, M 各々についてaccuracyが各々 0.4815, 0.6049, 0.7407という結果を得た(Fujimoto他)。 IU-XrayならびにMIMIC-CXR データセットを対象として、比較対象となる過去レポートの有無をモデルに組み込むことで、胸部X線画像から画像診断レポートを生成するモデルの性能が向上することを示した(Kim他、arXiv)。 COMETと呼ばれるアーキテクチャを画像診断レポートに用いることで、訓練されたモデルが従来のBERTscore, BLEU, CheXbertといった指標に加えて、人間による評価指標と高い相関を持ちうることを示した(Aoms他、arXiv)。
|