研究課題/領域番号 |
23KK0148
|
研究種目 |
国際共同研究加速基金(海外連携研究)
|
配分区分 | 基金 |
審査区分 |
中区分52:内科学一般およびその関連分野
|
研究機関 | 神戸大学 |
研究代表者 |
西尾 瑞穂 神戸大学, 未来医工学研究開発センター, 特命講師 (50581998)
|
研究分担者 |
藤本 晃司 京都大学, 医学研究科, 特定准教授 (10580110)
松尾 秀俊 神戸大学, 医学部附属病院, 助教 (20878251)
|
研究期間 (年度) |
2023-09-08 – 2026-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
21,060千円 (直接経費: 16,200千円、間接経費: 4,860千円)
2025年度: 3,770千円 (直接経費: 2,900千円、間接経費: 870千円)
2024年度: 9,100千円 (直接経費: 7,000千円、間接経費: 2,100千円)
2023年度: 8,190千円 (直接経費: 6,300千円、間接経費: 1,890千円)
|
キーワード | 深層学習 / 自然言語処理 / 放射線診断学 / レポート / summarization / 大規模言語モデル / 医療情報 |
研究開始時の研究の概要 |
大規模自然言語モデル(LLM)は汎用性が高く、Zero shot learningやFew shot learningで多数のタスクに対応可能と言われ、今後の活用が期待される。本研究では、主に放射線医学領域で扱われるテキスト(読影レポート)および画像を対象として、(1)オンプレミス(ローカル環境)で動作するLLMを開発し、(2)医療AI分野における日本語の医療情報の処理性能を改善する基盤モデルの研究を行う。
|
研究実績の概要 |
今年度、JMIDと呼ばれる日本医学放射線学会が管理・運用するデータベースを利用できた。JMIDのデータベースから100万件以上の放射線診断レポートを収集し、そのレポートから文章に関する深層学習のtransformerのモデルを作成した。作成したモデルでは、レポートの所見欄から診断欄を自動生成が可能となった。このモデルを評価し、その結果が査読付き英文誌に掲載された。また、transformer・大規模言語モデルの一つであるChatGPTを使って、レポートから肺癌のTNM分類を推定するモデルの作成も行い、NTCIR17でconference paperとして発表した。
胸部単純レントゲン写真からレポートの文章を直接に自動生成するシステムを作成した。作成したモデルはtransformerをベースにしたVision and Languageのモデルで、事前学習済みのtransformerをfine tuningすることでレポートの生成が可能となった。今年度は英語のレポートのみを対象とし、英語の文章としては問題のないレポートが生成出来た。上記に加えて、レポートの文章や医療画像に関する深層学習のモデルを作り、複数の論文が査読付き英文誌に掲載された。
上記の業績の一部はスイスのチューリッヒ大学との国際経共同研究の成果であった。2024年4月からは分担研究者の一人がチューリッヒ大学に留学し、数か月間チューリッヒ大学で共同研究をする予定である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
進捗として、主に(i)放射線診断レポートについての自然言語処理の研究、(ii)チューリッヒ大学との国際共同研究の結果が論文などに掲載されたこと、(iii)2024年4月から分担研究者がチューリッヒ大学での留学を開始したこと、の三つがあった。これらの点から研究はおおむね順調に進展していると考えられる。
|
今後の研究の推進方策 |
transformerベースの大規模言語モデルの放射線医学への応用について、チューリッヒ大学との国際共同研究を進める。2024年度は分担研究者が留学しているため、進捗が期待できる。
|