• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Building a Medical Language Resource Toward Secondary Use of Radiology Reports

Research Project

Project/Area Number 23K19977
Research Category

Grant-in-Aid for Research Activity Start-up

Allocation TypeMulti-year Fund
Review Section 1001:Information science, computer engineering, and related fields
Research InstitutionOsaka University

Principal Investigator

杉本 賢人  大阪大学, 大学院医学系研究科, 特任助教(常勤) (50984655)

Project Period (FY) 2023-08-31 – 2025-03-31
Project Status Granted (Fiscal Year 2023)
Budget Amount *help
¥2,600,000 (Direct Cost: ¥2,000,000、Indirect Cost: ¥600,000)
Fiscal Year 2024: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Fiscal Year 2023: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Keywords自然言語処理 / 情報抽出 / 言語資源の構築 / 医療言語資源 / 画像診断レポート / リアルワールドデータ
Outline of Research at the Start

電子カルテには診療に関する様々な情報が記載されており、研究への二次利用が期待されている。しかし、実際に利用が進んでいるのは、レセプト情報、検体検査の結果など形式が構造化されており、コードが整理された一部のデータに限定されている。本研究では、フリーテキストの画像診断レポートからの情報抽出を目的とし、放射線領域の多くの臨床概念を網羅した言語資源の構築を行う。これにより、自然言語処理を用いて構造化した結果へのコーディングが可能となり、画像診断レポートの情報を用いた研究の推進に寄与できる。また、情報抽出の結果をレポートの監査など診療支援に活用することで、医療の質の向上への貢献も期待できると考えられる。

Outline of Annual Research Achievements

我々が構築した深層学習による構造化システムを使用して、大阪大学医学部附属病院の胸腹部CTレポートを入力し、その出力からエンティティとして抽出した放射線領域に関する用語を収集した。抽出した用語には「解剖区域・臨床所見」のようなエンティティラベルが付与されており、「解剖区域・臨床所見」について、ラベル別に用語を頻度順で整理したデータセットを構築した。「解剖区域」については、合計63,384語のユニークな表現を収集した。そこから、まず、レポートでの出現頻度が3回以上の表現のみにフィルターし、15,314語の表現を取り出した。同様に、臨床所見についても、18,791語から、出現頻度が3回以上の表現のみにフィルターし、6,424語を取り出した。しかし、これらはシステムで取り出した表現であり、実際にはそのエンティティとして正しくない表現も含まれている。そこで、人手で表現を整理する作業を行った。次に、「解剖区域」について、専門家と議論し、用語の表記ゆれを整理した概念辞書テーブルを作成した。また、「解剖区域」の概念辞書にエントリーされた概念名称には「身体部位・臓器・臓器区分・側性」といった属性情報を付与した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

システムを用いてレポートから用語を抽出する作業については順調に進んでいる。そこから、どのように用語を整理するのかについては専門家と議論するべき点も多く、また、応用事例を考えながら適宜更新が必要になる作業になるので時間がかかっているが、スケジュール上は概ね問題ないと考える。

Strategy for Future Research Activity

人手で整理した「解剖区域」の各表現について、作成した概念辞書テーブルとの紐づけ作業を行う。これを早い段階で完成させることで、「解剖区域」に関する言語資源の構築を完了させる。「臨床所見」に関する表現についても同様に概念辞書を作成し、必要な属性を付与して、各表現と紐づける作業を実施する予定である。

Report

(1 results)
  • 2023 Research-status Report
  • Research Products

    (4 results)

All 2024 2023

All Journal Article (2 results) (of which Peer Reviewed: 2 results,  Open Access: 2 results) Presentation (2 results)

  • [Journal Article] Classification of Diagnostic Certainty in Radiology Reports with Deep Learning2024

    • Author(s)
      Sugimoto Kento、Wada Shoya、Konishi Shozo、Okada Katsuki、Manabe Shirou、Matsumura Yasushi、Takeda Toshihiro
    • Journal Title

      Studies in Health Technology and Informatics

      Volume: 1 Pages: 569-573

    • DOI

      10.3233/shti231029

    • ISBN
      9781643684567, 9781643684574
    • Related Report
      2023 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] Extracting Clinical Information From Japanese Radiology Reports Using a 2-Stage Deep Learning Approach: Algorithm Development and Validation2023

    • Author(s)
      Sugimoto Kento、Wada Shoya、Konishi Shozo、Okada Katsuki、Manabe Shirou、Matsumura Yasushi、Takeda Toshihiro
    • Journal Title

      JMIR Medical Informatics

      Volume: 11 Pages: e49041-e49041

    • DOI

      10.2196/49041

    • Related Report
      2023 Research-status Report
    • Peer Reviewed / Open Access
  • [Presentation] 画像診断レポートの二次利用に向けた 解剖学的区域に関する言語資源の構築2023

    • Author(s)
      杉本 賢人
    • Organizer
      第43回 日本医療情報学連合大会
    • Related Report
      2023 Research-status Report
  • [Presentation] 自然言語処理を用いた読影レポートから の重要所見の自動抽出に関する取り組み2023

    • Author(s)
      杉本 賢人
    • Organizer
      第43回 日本医療情報学連合大会
    • Related Report
      2023 Research-status Report

URL: 

Published: 2023-09-11   Modified: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi