研究課題/領域番号 |
15K08847
|
研究機関 | 高知大学 |
研究代表者 |
奥原 義保 高知大学, 教育研究部医療学系連携医学部門, 教授 (40233473)
|
研究分担者 |
畠山 豊 高知大学, 教育研究部医療学系連携医学部門, 准教授 (00376956)
渡部 輝明 高知大学, 教育研究部医療学系連携医学部門, 講師 (90325415)
中島 典昭 高知大学, 教育研究部医療学系連携医学部門, 助教 (00335928)
片岡 浩巳 高知大学, 教育研究部医療学系連携医学部門, 助教 (80398049)
寺田 典生 高知大学, 教育研究部医療学系臨床医学部門, 教授 (30251531)
堀野 太郎 高知大学, 教育研究部医療学系臨床医学部門, 講師 (90448382)
|
研究期間 (年度) |
2015-04-01 – 2018-03-31
|
キーワード | 病院情報システム / データマイニング / 電子カルテ / 病名信頼度 |
研究実績の概要 |
本研究は、病院情報システムに登録された病名について、登録前後の病院情報システムの様々な情報から信頼度を推定する方法を確立し、病院情報システムのデータを医学の発展のために活用できる基盤に貢献することを目的とする。 研究代表者等の所属する高知大学医学部では、既に各患者の基本情報やオーダデータを匿名化し、仮想デスクトップシステムで利用する環境を実現している。本研究ではさらに電子カルテ記載情報解析のためのDWH(データウェアハウス)化とその匿名化を行い解析データとする。このため、今年度は、まず電子カルテ記載情報のDWH化および匿名化を目指した。電子カルテのデータを、まず非匿名化DWH化し、次にオーダデータで既に運用しているのと同様の方法で匿名化を行った。 並行して、既に運用しているオーダデータ匿名化DWHを用いて、オーダデータだけでどの程度正確な評価ができるかを、相関分析やクラスタ分析によって検証するためのデータベース構築を行った。構築したデータベースを用い、確定病名毎に、共起する項目の特徴的なパターンを抽出するための予備解析やクラスタ分析によって特徴抽出を行うための予備解析を行った。 さらに、急性性腎障害(AKI)の一つである腎後性AKIを、オーダ情報および退院サマリの記載を連携することによって抽出可能か検討した。各退院サマリに対して潜在トピックモデルによって類似サマリを定義し、カテーテル実施履歴から腎後性の可能性データを抽出した。その可能性データにおける類似サマリの関係のみを評価することで評価作業軽減を実現した。入院期間中にAKI初回判定されたデータに対し適用し、オーダ情報だけでは必要条件のみを満たし、退院サマリの評価を加えることで十分条件も満たしたデータとなることを確認した。本手法によって、AKI解析に必要な患者データ群を適切に抽出することが可能であることが確認できた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
当初の計画では、電子カルテ記載情報についてはH27年度中に患者基本情報の部分を匿名化し、イベント情報を各患者の生年月日からの相対日付に置き換えたDWH(データウェアハウス)を構築、さらに自由記載部分についても、記載内容を形態素に分解したうえで固有名詞をマスキングして最終的な匿名化DWHとする予定であったが、記載内容の匿名化を行うシステムの設計に予想より時間がかかり、実装が間に合わなかった。 しかしながら、既に運用しているオーダデータの匿名化DWHを用いて、オーダデータだけでどの程度正確な評価ができるかを、予定していた相関分析だけではなくH28年度に予定していたクラスタ分析を前倒し実施し、病名毎に特徴的なパターンを抽出するための予備解析を行った。 さらに、本来はH28年以降に予定していた電子カルテ記載を考慮した解析を、オーダ情報および患者基本情報とイベント日付を匿名化した退院サマリ情報を用いて急性性腎障害(AKI)の一つである腎後性AKIを対象に前倒しして行った。その結果、入院期間中にAKI初回判定されたデータについて、オーダ情報だけでは必要条件のみを満たし、退院サマリの評価を加えることで十分条件も満たしたデータとなることを確認した。本手法によって、AKI解析に必要な患者データ群を適切に抽出することが可能であることが確認できた。
|
今後の研究の推進方策 |
今年度は、繰り延べた電子カルテ記載内容の匿名化を行うシステムの実装を速やかに行うとともに、対象病名の登録された1患者の1入院期間を1症例とし、それら各々につき、病名、検査、処方など異なるカテゴリー間の項目のペアを全て列挙、全症例数で正規化したペアの頻度を元に項目間距離を決め、ネットワーク解析を行い、その中心に対象病名が含まれるか、対象病名とつながるグループがどのくらいあるか、それらのパターンが病名の信頼度に対応しているかなどを臨床医の判断によって評価する。上記の距離情報を用いてクラスター解析も行い、対象病名とつながるクラスターがどのくらいあるか、それらのパターンが病名の信頼度に対応しているかを臨床医によって評価してもらう。これら2方法につき判別能を評価する。 さらに、相関分析で主要なものとして抽出された組み合わせに含まれる項目を対象に、潜在的Dirichlet配分法に基づく潜在トピックモデルによる特徴抽出によって、複数のトピックに分類できるか、それぞれのパターンが病名の信頼度に対応しているかを臨床医に判断してもらう。 潜在トピックモデルに必要なトピック数としては入院中にアクティブな病名の数を初期値とし、その前後の数で最適な値に調整する。年度後半では、上記の解析作業と平行して、電子カルテ解析用匿名化DWHを用いた解析の予備解析を行う。基本的解析方法はオーダデータの場合と同じ方法を適用する予定である。対象とする形態素はまず名詞だけとし、必要に応じて他の形態素を加える。
|
次年度使用額が生じた理由 |
当初の計画では、電子カルテ記載情報をH27年度中に患者基本情報を匿名化し、イベント情報を各患者の生年月日からの相対日付に置き換えたDWHを構築し、さらに自由記載部分についても、記載内容を形態素に分解したうえで固有名詞をマスキングして最終的な匿名化DWHとする予定であったが、記載内容の匿名化を行うシステムの設計に予想より時間がかかり、実装が間に合わなかった。このため、実装を次年度に繰り延べ、その費用が繰り越しとなった。
|
次年度使用額の使用計画 |
今年度は、繰り延べた記載内容の匿名化を行うシステムの実装を速やかに行い、繰り越し分の執行を行う。
|