• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Data structuring of electronic medical records and development of artificial intelligence-based model for disease diagnostic support using a novel natural language processing technology

Research Project

Project/Area Number 20K18874
Research Category

Grant-in-Aid for Early-Career Scientists

Allocation TypeMulti-year Fund
Review Section Basic Section 58010:Medical management and medical sociology-related
Research InstitutionGunma University

Principal Investigator

Noguchi Rei  群馬大学, 医学部附属病院, 助教 (50828861)

Project Period (FY) 2020-04-01 – 2024-03-31
Project Status Completed (Fiscal Year 2023)
Budget Amount *help
¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000)
Fiscal Year 2022: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2021: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2020: ¥1,820,000 (Direct Cost: ¥1,400,000、Indirect Cost: ¥420,000)
Keywords電子カルテデータ / 自然言語処理 / 非構造化データ / 診断支援AI / 疾患判別モデル / 症例マトリクス / テキストデータ構造化 / 類似症例予測AI / 病名予測モデル
Outline of Research at the Start

電子カルテのテキストデータには患者に関する重要かつ一貫した情報が含まれているが、非構造化データのため扱いが難しく十分に活用されていない。本研究では、新しい自然言語処理手法を活用し、電子カルテのテキストデータから疾患名・症状名を効率的に抽出し、症例ごとの疾患×症状の構造化データ(症例マトリクス)を自動生成する方法論を確立する。更に、症例マトリクスを学習データとして、実用レベルの精度を持った疾患分類AIモデルの構築を目指す。本研究は既存の電子カルテデータの活用可能性を広げるとともに、将来的な診断支援AI実現のコア技術となりえ、医療の質向上や均てん化、医師の負担軽減に大きく貢献できると考えられる。

Outline of Final Research Achievements

This study aims to build an AI that utilises text data from electronic medical records to provide diagnostic support for disease names based on descriptions in medical records.
Through this research, a methodology was established to extract disease and symptom names from text data in electronic medical records using natural language processing technology, and to automatically generate structured data (case matrix) of diseases and symptoms for each case. In addition, using the case matrix as training data, a machine learning model for disease classification (disease classification AI model) that can detect specific cardiovascular diseases with a maximum reproduction rate of 87% could be constructed.

Academic Significance and Societal Importance of the Research Achievements

真の診断支援AI の構築には、電子カルテのテキストデータの活用が不可欠であるが、非構造化データのために扱いが難しくまだ十分に活用されていない。本研究は既存の電子カルテデータの活用可能性を広げるとともに、将来的な診断支援AI の実現に向けたコア技術となるものであり、医療の質向上や均てん化、医師の負担軽減に大きく貢献できると考えられる。

Report

(5 results)
  • 2023 Annual Research Report   Final Research Report ( PDF )
  • 2022 Research-status Report
  • 2021 Research-status Report
  • 2020 Research-status Report
  • Research Products

    (19 results)

All 2023 2022 2021 2020

All Journal Article (8 results) (of which Peer Reviewed: 7 results,  Open Access: 1 results) Presentation (11 results) (of which Int'l Joint Research: 2 results)

  • [Journal Article] 電子カルテテキストデータの臨床活用に向けた汎用性の高いデータ構造化フレームワークと機械学習応用2023

    • Author(s)
      野口怜, 鳥飼幸太, 齋藤勇一郎
    • Journal Title

      Mumps

      Volume: 30 Pages: 51-57

    • Related Report
      2023 Annual Research Report
    • Peer Reviewed
  • [Journal Article] 電子カルテテキストから構築した症例マトリクスによる協調フィルタリングベースの類似症例予測2022

    • Author(s)
      野口 怜, 鳥飼 幸太, 齋藤 勇一郎
    • Journal Title

      医療情報学

      Volume: Vol.42 (Suppl.) Pages: 908-911

    • Related Report
      2022 Research-status Report
    • Peer Reviewed
  • [Journal Article] HL7 FHIR / Web アークテクチャ / 医療サイバーセキュリティ / 稼働継続性を重視した Virtual Fault Tolerance (VFT)コンセプトに基づく 病院情報システムの設計と実装2022

    • Author(s)
      鳥飼 幸太, 野口 怜, 松山 龍之介, 齋藤 勇一郎
    • Journal Title

      医療情報学

      Volume: Vol.42 (Suppl.) Pages: 741-742

    • Related Report
      2022 Research-status Report
    • Peer Reviewed
  • [Journal Article] GunNLP at the NTCIR-16 Real-MedNLP Task: Collaborative Filtering-based Similar Case Identification Method via structured data “Case Matrix”2022

    • Author(s)
      Rei Noguchi
    • Journal Title

      Proceedings of the 16th NTCIR Conference on Evaluation of Information Access Technologies

      Volume: 1 Pages: 349-352

    • Related Report
      2022 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] 電子カルテテキストから構築した症例マトリクスによる協調フィルタリングベースの類似症例予測2021

    • Author(s)
      野口 怜, 鳥飼 幸太, 齋藤 勇一郎
    • Journal Title

      医療情報学

      Volume: Vol.41 (Suppl.) Pages: 928-931

    • Related Report
      2021 Research-status Report
    • Peer Reviewed
  • [Journal Article] e-Path 3層構造とFHIRを擁する医療ロジックの共通化モデルに適したIn-Process Clinical Intelligence(IPCI)の設計と実装2021

    • Author(s)
      鳥飼 幸太, 野口 怜, 松山 龍之介, 白戸 悠貴, 齋藤 勇一郎
    • Journal Title

      医療情報学

      Volume: Vol.41 (Suppl.) Pages: 858-860

    • Related Report
      2021 Research-status Report
    • Peer Reviewed
  • [Journal Article] オープンデータを活用したCOVID-19罹患者における症状・経過のテキスト分析2020

    • Author(s)
      野口 怜 , 鳥飼 幸太 , 齋藤 勇一郎
    • Journal Title

      医療情報学

      Volume: Vol.40 (Suppl.) Pages: 504-509

    • Related Report
      2020 Research-status Report
    • Peer Reviewed
  • [Journal Article] 電子カルテデータ構造化による症例マトリクスと疾患判別モデルの臨床導入意義2020

    • Author(s)
      野口 怜 , 鳥飼 幸太 , 齋藤 勇一郎
    • Journal Title

      月刊新医療

      Volume: 48 Pages: 45-49

    • Related Report
      2020 Research-status Report
  • [Presentation] 電子カルテテキストの構造化とスパース推定による疾患特異的な特徴語抽出に基づく説明性の高い病名予測モデルの構築2023

    • Author(s)
      野口怜, 鳥飼幸太, 齋藤勇一郎
    • Organizer
      第5回 日本メディカルAI学会学術集会
    • Related Report
      2023 Annual Research Report
  • [Presentation] Investigation of medical accidents for the development of alert system to reduce alert fatigue2023

    • Author(s)
      Yuki Shiroto, Kota Torikai, Rei Noguchi, Yuichiro Saito
    • Organizer
      MEDINFO 2023: 19th World Congress on Medical and Health Informatics
    • Related Report
      2023 Annual Research Report
    • Int'l Joint Research
  • [Presentation] 電子カルテテキストから構築した症例マトリクスによる協調フィルタリングベースの類似症例予測2022

    • Author(s)
      野口 怜, 鳥飼 幸太, 齋藤 勇一郎
    • Organizer
      第42回医療情報学連合大会
    • Related Report
      2022 Research-status Report
  • [Presentation] HL7 FHIR / Web アークテクチャ / 医療サイバーセキュリティ / 稼働継続性を重視した Virtual Fault Tolerance (VFT)コンセプトに基づく 病院情報システムの設計と実装2022

    • Author(s)
      鳥飼 幸太, 野口 怜, 松山 龍之介, 齋藤 勇一郎
    • Organizer
      第42回医療情報学連合大会
    • Related Report
      2022 Research-status Report
  • [Presentation] GunNLP at the NTCIR-16 Real-MedNLP Task: Collaborative Filtering-based Similar Case Identification Method via structured data “Case Matrix”2022

    • Author(s)
      Rei Noguchi
    • Organizer
      The 16th NTCIR Conference
    • Related Report
      2022 Research-status Report
    • Int'l Joint Research
  • [Presentation] 野口 怜, 鳥飼 幸太, 齋藤 勇一郎2021

    • Author(s)
      退院サマリから構築した症例マトリクス学習モデルと経過記録テキストからの疾患判別予測
    • Organizer
      第3回 日本メディカルAI学会学術集会
    • Related Report
      2021 Research-status Report
  • [Presentation] 電子カルテテキストから構築した症例マトリクスによる協調フィルタリングベースの類似症例予測2021

    • Author(s)
      野口 怜, 鳥飼 幸太, 齋藤 勇一郎
    • Organizer
      第41回医療情報学連合大会
    • Related Report
      2021 Research-status Report
  • [Presentation] e-Path 3層構造とFHIRを擁する医療ロジックの共通化モデルに適したIn-Process Clinical Intelligence(IPCI)の設計と実装2021

    • Author(s)
      鳥飼 幸太, 野口 怜, 松山 龍之介, 白戸 悠貴, 齋藤 勇一郎
    • Organizer
      第41回医療情報学連合大会
    • Related Report
      2021 Research-status Report
  • [Presentation] 電子カルテデータを構造化した症例マトリクスによる疾患判別モデルの構築と表記揺れ集約の効果2020

    • Author(s)
      野口 怜 , 鳥飼 幸太 , 齋藤 勇一郎
    • Organizer
      第24回日本医療情報学会春季学術大会
    • Related Report
      2020 Research-status Report
  • [Presentation] 診療記録の一次利用に向けたテキスト前処理フレームワークおよび症例マトリクスの提案と評価2020

    • Author(s)
      野口 怜 , 鳥飼 幸太 , 齋藤 勇一郎
    • Organizer
      第48回日本Mテクノロジー学会大会
    • Related Report
      2020 Research-status Report
  • [Presentation] オープンデータを活用したCOVID-19罹患者における症状・経過のテキスト分析2020

    • Author(s)
      野口 怜 , 鳥飼 幸太 , 齋藤 勇一郎
    • Organizer
      第40回医療情報学連合大会
    • Related Report
      2020 Research-status Report

URL: 

Published: 2020-04-28   Modified: 2025-01-30  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi