臨床検査を対象とした医療ビッグデータ構築支援AIエンジンの開発

研究課題

研究課題/領域番号	23K11893
研究種目	基盤研究(C)
配分区分	基金
応募区分	一般
審査区分	小区分90130:医用システム関連
研究機関	広島大学
研究代表者	粂直人広島大学, 病院(医), 共同研究講座教授 (00456881)
研究期間 (年度)	2023-04-01 – 2026-03-31
研究課題ステータス	交付 (2023年度)
配分額 *注記	4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円) 2025年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円) 2024年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円) 2023年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
キーワード	標準化 / 臨床検査マスター / 人工知能 / 臨床検査 / 次世代医療基盤法 / リアルワールドデータ
研究開始時の研究の概要	本研究は，臨床検査結果を対象として，複数の医療機関のデータを統合した医療ビッグデータの構築を目指す研究である．昨今，医療ビッグデータを用いた人工知能などの先進技術による疫学研究，創薬等の医療技術の発展が求められ，医学的成果を求める研究に注目が集まる傾向が高い．しかし，そもそも課題となるのは人工知能の学習に用いる医療ビッグデータをどの様に構築するかである．本研究は，従来，臨床検査技師が必要な際に必要な範囲で手動でデータ項目を突合していたのに対し，半自動で検査結果の突合が可能な技術の獲得を目指す．
研究実績の概要	本研究は，臨床検査結果の多施設横断の統合を目的として，複数医療機関のデータを半自動で統合する人工知能技術（AI技術）を開発し，医療ビッグデータ構築にかかる労力を劇的に低減することで，医療ビッグデータを用いた研究の加速化を促す．現状の複数の医療機関データを用いたリアルワールドデータ研究は，受領したデータから分析をスタートさせる形態の研究が中心で，受領したデータを複数施設間でどのように整合させてから分析しているのかほとんど加味されていない．そこで，本研究では，これまでに，複数医療機関の検査データを実績の検査結果とともに受領し，複数医療機関間の検査マスターに用いられる用語の差異を比較した．実績データから各病院の現在運用されている検査項目名称を抽出し，検査項目名称の命名規則がそれぞれの施設で異なることを確認した．特に，検査名称の表記揺れのみならず，緊急検査や，単位違い等の検査の運用に関わる用語やコードまでが名称に付与されており使い分けられている事例が多数見つかった．このことから，施設横断的な検査項目間の突合には検査結果値まで含めた学習が必要であると考えられた．また，これまでに所属機関である広島大学病院の検査マスターと検査実績値に適用される検査項目名称のゆらぎ及び，電子カルテ，DWH，統合データベースのそれぞれから取得できる検査項目名称と結果値の対応関係について調査した．これは，各病院から出力データとして受領できる検査結果値に付与される検査項目名称と，実際に院内で運用されている検査項目名称にどの程度の差異があるのかを明らかにするためである．以上より，AIが学習可能な形で検査実績値の構造を定義するための，複数医療機関の検査項目出現パターン（バリエーション）と，特定病院の検査項目の運用場面毎の出力データの差異（深さ）の両方の知見を得ることができた．
現在までの達成度 (区分)	現在までの達成度 (区分) 3: やや遅れている理由広島大学病院の検査マスターと検査実績値に適用される検査項目名称のゆらぎについて調査するなかで，そもそも検査マスターが電子カルテと部門システム間で同様の粒度で管理されているわけではないことが判明した．DWHに登録されている検査名称と，電子カルテに表示される検査名称にも差異があり，また，電子カルテ外にデータを保存する利活用を目的とした統合データベースに出力されている検査項目名称がどこのデータを由来としているのか調査するために時間を要した．また，複数医療機関（36施設）の検査実績データを次世代医療基盤法認定事業者から受領するために時間を要し，そもそも分析に取り掛かるまでに時間を要した．また複数医療機関間の検査実績データから検査項目名称の構造をある程度判別できると予想していたが，予想を超えるバリエーションがあり，同一電子カルテベンダーの電子カルテを採用している病院間であっても検査項目の運用方法に差異があり，単純に構造を比較できなかったことから，そもそもAIに学習させるデータフォーマットとしてどのような構成を用意するべきか判断に時間を要している．したがって，適用するAIモデルの再調査を実施し，どのような学習が可能か，既存の手法についてさらに調査するために時間を要した結果，想定よりも遅れている状況であると認識している．
今後の研究の推進方策	今後，複数施設の検査実績値をAIモデルに適用可能な構造データに変換するために，AIが学習すべき実績値の読み方について考察する．標準検査マスターと考えうる標準施設の選定を行い，当該施設の検査項目名称を基準として他施設の検査項目名称がどの程度離れているか，差分を自動的に算出できるか試みる．検査項目名称の比較と，検査結果値を用いた検査項目推定の両面からAI技術の適用モデルを設計する．また，広島大学病院の検査項目を例に，検査データの取扱の運用を引き続き確認し，データ取得場所による検査項目名称と結果値にズレがないか検証することで，本来部門システムから直接データを取得するべきなのか，あるいは電子カルテに登録されているデータをそのまま用いても問題ないのかも含めてデータソースの検証を進める．教師あり学習を前提として，多施設間ですでに同一項目とわかっている検査項目群についてAIに検査値を学習させるプロトタイプを構築し，施設間で検査値の分布を比較し，同じ検査項目と思われるものを候補として列挙できるか検証する予定である．その後最終的には，検査項目名称を含む検査実績値を問い合わせることで，基準値の差異を加味して標準名称（あるいは標準コード）を応答するAIモデルを構築できるか試みたいと考えている．

報告書

(1件)

2023 実施状況報告書