2023 Fiscal Year Research-status Report
Project/Area Number |
23K07154
|
Research Institution | Kyoto University |
Principal Investigator |
藤本 晃司 京都大学, 医学研究科, 特定准教授 (10580110)
|
Project Period (FY) |
2023-04-01 – 2026-03-31
|
Keywords | 深層学習 / 自然言語処理 / 大規模言語モデル |
Outline of Annual Research Achievements |
胸部X線画像のデータセットであるMIMIC-CXR並びにJMIDを対象として、T5モデルを4種類構築した。定量評価指標としてROUGEスコアを用い、画像診断レポートの要約に関する性能を評価し最も性能の高いモデルを抽出した。また、自動要約されたレポート文の一部について、画像診断医による定性評価を実施した結果、得られたレポート文のうち85-86%が臨床的に有用であると考えられた(Nishio他)。 NTCIR-17のshared taskとして実施された、肺癌を対象とした画像診断レポートからTNM分類を推定するという課題に対して、(1)ChatGPTおよびLangChainを用いたプロンプトエンジニアリングによるzero-shot分類を実施し、T, N, M 各々についてaccuracyが各々 0.3951, 0.8025, 0.9259という結果を得た(Nishio他)。(2)openCALM-7B並びに独自に作成した肺癌のステージングに関するextended QAデータセットを用いて、オンプレミスでfine tuningを実施し、T, N, M 各々についてaccuracyが各々 0.4815, 0.6049, 0.7407という結果を得た(Fujimoto他)。 IU-XrayならびにMIMIC-CXR データセットを対象として、比較対象となる過去レポートの有無をモデルに組み込むことで、胸部X線画像から画像診断レポートを生成するモデルの性能が向上することを示した(Kim他、arXiv)。 COMETと呼ばれるアーキテクチャを画像診断レポートに用いることで、訓練されたモデルが従来のBERTscore, BLEU, CheXbertといった指標に加えて、人間による評価指標と高い相関を持ちうることを示した(Aoms他、arXiv)。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究期間には、(1)胸部X線画像を対象とした画像診断レポートの要約に関する研究(2)肺癌を対象とした画像診断レポートからのTNM分類の推定に関する研究(3)胸部X線画像から画像診断レポートを生成するモデルの性能向上に関する研究(4)生成された画像診断レポートの性能評価指標の改善に関する研究を実施した。(2)においては独自に作成したQApairを用いることで性能の向上を図った。これらの研究成果は、本研究の目的である医用画像QAエージェントの各コンポーネントごとの性能改善に繋がると考えられる。
|
Strategy for Future Research Activity |
今年度の成果で得られた各コンポーネントごとの性能向上を図りつつ、image-to-text, text-to-textの各コンポーネントの連携部分についても注力してゆく予定である。
|
Causes of Carryover |
当初はGPUを搭載したワークステーションを購入して使用する予定であったが、今年度は大型計算機センターを活用することとしたため、GPU搭載ワークステーションを購入しなかった。しかしながら、大型計算機センターを通じた研究環境はやや柔軟性に欠けるため、次年度以降にはオンプレミス型のGPU搭載ワークステーションを購入して活用する予定としている。
|