• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2021 Fiscal Year Research-status Report

Data structuring of electronic medical records and development of artificial intelligence-based model for disease diagnostic support using a novel natural language processing technology

Research Project

Project/Area Number 20K18874
Research InstitutionGunma University

Principal Investigator

野口 怜  群馬大学, 医学部附属病院, 助教 (50828861)

Project Period (FY) 2020-04-01 – 2023-03-31
Keywords電子カルテデータ / 自然言語処理 / 非構造化データ / テキストデータ構造化 / 診断支援AI / 疾患判別モデル / 症例マトリクス / 類似症例予測AI
Outline of Annual Research Achievements

本研究は、電子カルテのテキストデータを活用し、診療録の記述に基づいて疾患名の診断支援を行うAI構築を目指すものである。
2020年度に確立した「症例マトリクス」の構築手法に基づいて、2021年度は、この症例マトリクスを学習データとした機械学習モデルの構築に注力した。具体的には、疾患判別および、類似症例予測の機械学習モデル構築を試み、いずれも一定の精度を持つモデルが得られ、本研究のアプローチの有用性が示された。

■疾患判別モデルの構築:当院10年分の退院時サマリーから抽出された症例マトリクスを活用し、主病名が主要な循環器疾患8種である症例に対して、症例マトリクス内の疾患名と特徴語(当該症例の退院サマリーより抽出された主に症状などの疾患特異的な単語)との関係性を機械学習手法を用いて学習させた。学習データに対しては、特定の循環器疾患を最大で再現率87%で検出可能なモデルを構築できた。

■類似症例予測モデルの構築:疾患判別モデルと同様に、主病名を循環器疾患8種に限定した上で、複数回入院患者を除いた約1,000例分の症例マトリクスを学習データとした。この症例マトリクスに対して、ECサイトのレコメンデーションに頻用されるユーザベースの協調フィルタリングを適用し、類似症例予測のフレームワークを構築した。入力となる1症例分の単語集計結果(=症例ベクトル)と、症例マトリクス内の各症例ベクトルとの相関係数を算出し、症例マトリクスの中から類似の症例を抽出する構成とした。性能評価として、症例マトリクスから1症例のみを抽出し、これを未知の症例ベクトルとして与えて、残りの症例から類似症例を抽出する実験を、全症例に対して逐次行った。結果として、約3割の症例で、基準(相関係数0.3以上かつ、一致した特徴語数が3語以上)を満たす類似症例が抽出され、約1割の症例では、類似症例の主病名が入力症例の主病名と一致した。

Current Status of Research Progress
Current Status of Research Progress

1: Research has progressed more than it was originally planned.

Reason

当初の計画では、
・2020年度:退院サマリーデータ抽出およびデータ構造化の手法構築
・2021年度:症例マトリクス構築手法の確立
・2022年度:疾患判別AIの構築
であったが、2021年度までに、前倒しで疾患判別AIのベースとなる機械学習モデルを構築しており、当初の計画以上に進展していると言える。また、当初計画になかった、「類似症例予測モデル」も構築することができ、進捗状況は芳しい。

Strategy for Future Research Activity

前倒しで進捗できている分、最終年にあたる2022年度は、より実運用に近づけるよう、モデルチューニングおよび、モデル汎用性の向上に注力していく。特に、精度についてはまだまだ向上が必要である。
具体的には、現状、超高次元行列となっている症例マトリクスを、スパースモデリングなどの数理的手法や、事前知識との組み合わせなどにより、次元削減や重みづけを行い、予測力の向上を試みる。また、退院サマリーだけでなく、日常診療の診察記事や各種検査結果のデータも組み合わせて活用していくことで、さらなる精度向上を図りたい。
また、本フレームワークは、他病院の退院サマリーにも適用可能な手法であることから、他病院データとの連携可能性についても模索していく予定である。

Causes of Carryover

新型コロナウイル感染症拡大に伴い、国内/海外の出張のほとんどがキャンセルとなっため、旅費が大幅に削減されたことが最大の理由である。

  • Research Products

    (5 results)

All 2021

All Journal Article (2 results) (of which Peer Reviewed: 2 results) Presentation (3 results)

  • [Journal Article] 電子カルテテキストから構築した症例マトリクスによる協調フィルタリングベースの類似症例予測2021

    • Author(s)
      野口 怜, 鳥飼 幸太, 齋藤 勇一郎
    • Journal Title

      医療情報学

      Volume: Vol.41 (Suppl.) Pages: 928-931

    • Peer Reviewed
  • [Journal Article] e-Path 3層構造とFHIRを擁する医療ロジックの共通化モデルに適したIn-Process Clinical Intelligence(IPCI)の設計と実装2021

    • Author(s)
      鳥飼 幸太, 野口 怜, 松山 龍之介, 白戸 悠貴, 齋藤 勇一郎
    • Journal Title

      医療情報学

      Volume: Vol.41 (Suppl.) Pages: 858-860

    • Peer Reviewed
  • [Presentation] 野口 怜, 鳥飼 幸太, 齋藤 勇一郎2021

    • Author(s)
      退院サマリから構築した症例マトリクス学習モデルと経過記録テキストからの疾患判別予測
    • Organizer
      第3回 日本メディカルAI学会学術集会
  • [Presentation] 電子カルテテキストから構築した症例マトリクスによる協調フィルタリングベースの類似症例予測2021

    • Author(s)
      野口 怜, 鳥飼 幸太, 齋藤 勇一郎
    • Organizer
      第41回医療情報学連合大会
  • [Presentation] e-Path 3層構造とFHIRを擁する医療ロジックの共通化モデルに適したIn-Process Clinical Intelligence(IPCI)の設計と実装2021

    • Author(s)
      鳥飼 幸太, 野口 怜, 松山 龍之介, 白戸 悠貴, 齋藤 勇一郎
    • Organizer
      第41回医療情報学連合大会

URL: 

Published: 2022-12-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi