研究課題/領域番号 |
20K11833
|
研究機関 | 福井工業大学 |
研究代表者 |
芥子 育雄 福井工業大学, 工学部, 教授 (40815867)
|
研究分担者 |
中川 肇 富山大学, 学術研究部医学系, 教授 (30135256) [辞退]
林 篤志 富山大学, 学術研究部医学系, 教授 (20283773)
辻岡 和孝 金城大学, 社会福祉学部, 講師 (50724960) [辞退]
|
研究期間 (年度) |
2020-04-01 – 2024-03-31
|
キーワード | 意味表現学習 / 病名シソーラス / 病名推定 / ICD10 / ニューラルネットワーク / 退院サマリ / BERT / 生成AI |
研究実績の概要 |
本研究では、病名シソーラスに基づく医療用意味表現学習により、退院サマリからの病名推定の精度と解釈性を向上させる新たな手法を開発した。本手法により、推定される病名の90%でその上位概念を表す特徴単語が重要であることが明らかになった。 富山大学附属病院の新旧電子カルテを元に、新電子カルテの出現頻度上位20位の診断病名に対応する旧電子カルテを教師データとし、新電子カルテをテストデータとするベンチマークを構築した。医療用意味表現学習は、従来の百科事典に基づく汎用的な意味表現学習手法と比較して病名推定のマクロ平均F値を約10ポイント向上させ、72.1に達した。精度はさらなる改善が必要だが、診断プロセスの解釈が容易になったことは重要な進歩である。 大規模言語モデルの一つであるBERTを用いて教師データに微調整することでマクロ平均F値をさらに10ポイント以上向上させ、UTH-BERTを使用した際は85.3を記録した。しかし、モデルの解釈性には依然として課題が残されている。 今年度の主な成果は、患者の主訴のみを対象とした生成AIによる病名推定実験である。ICD-10の中分類で新電子カルテの出現頻度が高い上位20病名を基に200件のテストデータを作成し、ゼロショット学習、フューショット学習、RAG(検索拡張生成)の評価では、RAGが最も高い性能を示した。RAGはテストデータを含む全主訴で最高のTop5精度84.5%を示し、テストデータを除外するとTop5精度が65.5%まで低下した。また、最適なチャンク数は15件であることも明らかになり、参照データの選定が精度に大きく影響することを示した。 今後はICD-10の中分類全体を対象にテストデータを拡大し、広範囲な評価を進める予定である。その結果を基に医師による評価を行い、主訴からの病名推定を医療現場での診断支援ツールとして実用化することを目指す。
|
備考 |
令和5年7月9日(日)14:00~15:30に福井県生活学習館で開催された令和5年度福井ライフ・アカデミー主催ふるさと未来講座「現代社会」福井①において、「地域におけるSociety5.0の実践事例とChatGPT/GPT-4による試作と展望」の演題で、講演を行った。本講演の中で、「解釈性のある病名推定システムの実現による地域医療への貢献を目指して」を紹介した。
|