研究課題/領域番号 |
22K10535
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分58030:衛生学および公衆衛生学分野関連:実験系を含まない
|
研究機関 | 順天堂大学 |
研究代表者 |
明石 敏昭 順天堂大学, 医学部, 准教授 (40623492)
|
研究期間 (年度) |
2022-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,030千円 (直接経費: 3,100千円、間接経費: 930千円)
2024年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2023年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2022年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
|
キーワード | データベース / 言語解析 / CT / MR / 自然言語処理 / サーベイランス |
研究開始時の研究の概要 |
COVID-19肺炎の世界的なパンデミックの初期において、PCR検査の不足が問題となったが、CTが普及している日本においては画像診断が迅速・簡便であることから、肺炎のスクリーニングとしてCTによる画像診断が有効であった。そこで、本邦屈指の医療系ビッグデータである日本医用画像データベース(J-MID)にある約100万件の画像診断レポートを利用して、特定の疾患や画像所見の有無の事実性を判定するBERT言語モデルを開発し、自然言語処理を用いることによって、疾患の全国的な発生状況をモニタリング可能であることを実証し、画像診断レポートによる疾患サーベイランス法を確立する。
|
研究実績の概要 |
医療情報を全国10施設の大学病院から一元的に画像および画像診断レポートを収集している日本医用画像データベース(Japan-MedicalImage Database; JMID)には5億枚、150万件を超える検査が収集されているが、2023年4月にシステムをオンプレミスサーバーからクラウド化し、大量のデータを容易に検索し、ダウンロードすることを可能にした。 当初は対象とする疾患名もしくは画像所見の有無を判定するBERTを用いた事実性判定モデルを作成することを目標としていたが、この数年で自然言語解析の進歩が著しく、計画を再検討した。まずは、レポートにCOVID-19に関連する単語とAIによってCOVID-19肺炎と典型度が高いと判断された胸部CTとの相関を検討した結果、画像よりも明らかにレポートとの相関が高いことが判明した。また、レポートを用いて下垂体腺腫の症例をJ-MIDから抽出し、造影MRIのダイナミックスタディーにおける病変抽出を行うAIを作成に利用した。 また、データベースの整備として、人工知能を用いて検査情報の構造化(モダリティ、検査部位、画像の種類、造影の有無などをDICOMのメタデータおよび画像から統一されたオントロジーに従って分類)を行ない、検索性能の向上に努めているが、その精度について検討中である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
利用しているデータベースのシステム基盤が改築されたため、すでに準備していたシステムが機能しなくなり、適宜対応している。また、自然言語解析の進歩が著しく、それに伴った計画の調整を行なっている。
|
今後の研究の推進方策 |
現在検査の抽出には検査の構造化が不十分で、適切な検査の抽出ができない。これを解決するために人工知能を用いたシステムを整え、自然言語によるレポートの検索性能の向上を図る。
|