2023 Fiscal Year Research-status Report

Development of Supportive Artificial Intelligence of Medical Bigdata Creation for Laboratory Test Results

Research Project

Project/Area Number	23K11893
Research Institution	Hiroshima University
Principal Investigator	粂直人広島大学, 病院(医), 共同研究講座教授 (00456881)
Project Period (FY)	2023-04-01 – 2026-03-31
Keywords	標準化 / 臨床検査マスター / 人工知能
Outline of Annual Research Achievements	本研究は，臨床検査結果の多施設横断の統合を目的として，複数医療機関のデータを半自動で統合する人工知能技術（AI技術）を開発し，医療ビッグデータ構築にかかる労力を劇的に低減することで，医療ビッグデータを用いた研究の加速化を促す．現状の複数の医療機関データを用いたリアルワールドデータ研究は，受領したデータから分析をスタートさせる形態の研究が中心で，受領したデータを複数施設間でどのように整合させてから分析しているのかほとんど加味されていない．そこで，本研究では，これまでに，複数医療機関の検査データを実績の検査結果とともに受領し，複数医療機関間の検査マスターに用いられる用語の差異を比較した．実績データから各病院の現在運用されている検査項目名称を抽出し，検査項目名称の命名規則がそれぞれの施設で異なることを確認した．特に，検査名称の表記揺れのみならず，緊急検査や，単位違い等の検査の運用に関わる用語やコードまでが名称に付与されており使い分けられている事例が多数見つかった．このことから，施設横断的な検査項目間の突合には検査結果値まで含めた学習が必要であると考えられた．また，これまでに所属機関である広島大学病院の検査マスターと検査実績値に適用される検査項目名称のゆらぎ及び，電子カルテ，DWH，統合データベースのそれぞれから取得できる検査項目名称と結果値の対応関係について調査した．これは，各病院から出力データとして受領できる検査結果値に付与される検査項目名称と，実際に院内で運用されている検査項目名称にどの程度の差異があるのかを明らかにするためである．以上より，AIが学習可能な形で検査実績値の構造を定義するための，複数医療機関の検査項目出現パターン（バリエーション）と，特定病院の検査項目の運用場面毎の出力データの差異（深さ）の両方の知見を得ることができた．
Current Status of Research Progress	Current Status of Research Progress 3: Progress in research has been slightly delayed. Reason 広島大学病院の検査マスターと検査実績値に適用される検査項目名称のゆらぎについて調査するなかで，そもそも検査マスターが電子カルテと部門システム間で同様の粒度で管理されているわけではないことが判明した．DWHに登録されている検査名称と，電子カルテに表示される検査名称にも差異があり，また，電子カルテ外にデータを保存する利活用を目的とした統合データベースに出力されている検査項目名称がどこのデータを由来としているのか調査するために時間を要した．また，複数医療機関（36施設）の検査実績データを次世代医療基盤法認定事業者から受領するために時間を要し，そもそも分析に取り掛かるまでに時間を要した．また複数医療機関間の検査実績データから検査項目名称の構造をある程度判別できると予想していたが，予想を超えるバリエーションがあり，同一電子カルテベンダーの電子カルテを採用している病院間であっても検査項目の運用方法に差異があり，単純に構造を比較できなかったことから，そもそもAIに学習させるデータフォーマットとしてどのような構成を用意するべきか判断に時間を要している．したがって，適用するAIモデルの再調査を実施し，どのような学習が可能か，既存の手法についてさらに調査するために時間を要した結果，想定よりも遅れている状況であると認識している．
Strategy for Future Research Activity	今後，複数施設の検査実績値をAIモデルに適用可能な構造データに変換するために，AIが学習すべき実績値の読み方について考察する．標準検査マスターと考えうる標準施設の選定を行い，当該施設の検査項目名称を基準として他施設の検査項目名称がどの程度離れているか，差分を自動的に算出できるか試みる．検査項目名称の比較と，検査結果値を用いた検査項目推定の両面からAI技術の適用モデルを設計する．また，広島大学病院の検査項目を例に，検査データの取扱の運用を引き続き確認し，データ取得場所による検査項目名称と結果値にズレがないか検証することで，本来部門システムから直接データを取得するべきなのか，あるいは電子カルテに登録されているデータをそのまま用いても問題ないのかも含めてデータソースの検証を進める．教師あり学習を前提として，多施設間ですでに同一項目とわかっている検査項目群についてAIに検査値を学習させるプロトタイプを構築し，施設間で検査値の分布を比較し，同じ検査項目と思われるものを候補として列挙できるか検証する予定である．その後最終的には，検査項目名称を含む検査実績値を問い合わせることで，基準値の差異を加味して標準名称（あるいは標準コード）を応答するAIモデルを構築できるか試みたいと考えている．
Causes of Carryover	本来，認定事業者からのデータ受領後に，データ構造分析の一部をデータ分析業者に委託して受領データの構造化を行う予定であったが，データ受領が年末までずれ込んだため具体的な発注に至らなかった．そのため，その他項目の執行ができなかった．また，データ容量も予想できなかったことから，物品費としての分析サーバ等の準備も行わなかったため，結果的に手持ちのパソコンで一次処理を実施するにとどまったため，物品費の執行もなかった．今後，前年度予定だった作業を進めていくために今年度計画・前年度計画を合わせて実施していく．