研究課題/領域番号 |
15K08847
|
研究機関 | 高知大学 |
研究代表者 |
奥原 義保 高知大学, 教育研究部医療学系連携医学部門, 教授 (40233473)
|
研究分担者 |
畠山 豊 高知大学, 教育研究部医療学系連携医学部門, 准教授 (00376956)
渡部 輝明 高知大学, 教育研究部医療学系連携医学部門, 講師 (90325415)
中島 典昭 高知大学, 教育研究部医療学系連携医学部門, 助教 (00335928)
片岡 浩巳 川崎医療福祉大学, 医療福祉マネジメント学部, 教授 (80398049)
寺田 典生 高知大学, 教育研究部医療学系臨床医学部門, 教授 (30251531)
堀野 太郎 高知大学, 教育研究部医療学系臨床医学部門, 講師 (90448382)
|
研究期間 (年度) |
2015-04-01 – 2018-03-31
|
キーワード | 病院情報システム / データマイニング / 電子カルテ / 病名信頼度 |
研究実績の概要 |
本研究は、病院情報システムに登録された病名について、登録前後の病院情報システムの様々な情報から信頼度を推定する方法を確立し、病院情報システムのデータを医学の発展のために活用できる基盤に貢献することを目的とする。 H28年度は、電子カルテデータの匿名化DWHから退院サマリデータを対象とし、全テキストデータに対し、ComeJisyoV5-1を辞書データとしてmecabで形態素解析を実施、抽出した形態素を各サマリの出現順序数及び詳細品詞情報を保持させたまま、データベースとして構築した。形態素解析における固有名詞については、個人の特定を防ぐためのマスキングを行うことを目指している。実際に退院サマリーに見られ、個人の特定につながると考えられる固有名詞としては、人名、地名、医療機関名、などがあることがわかり、人名事典、地名辞典や医療機関名マスタを辞書データに加えることにより対応が可能になる見通しである。こうした匿名化退院サマリーDWHに加えて、信頼度が高い病名のデータセットを作成するために、DPCデータを匿名化したDWHの構築も行った。 並行して、既に運用しているオーダデータの匿名化DWHを用いて、オーダデータだけでどの程度正確な評価ができるかを、Association分析やクラスタ分析、決定木、ランダムフォレストなど様々な手法によって、確定病名毎に、共起する他の病名、検査項目、処方、処置・手術項目などの特徴的なパターンを抽出するための解析を行った。対象とした病名は、糖尿病、脂肪肝、NASH、細菌性髄膜脳炎、ウィルス性髄膜脳炎、逆流性食道炎などである。その結果、決定木、ランダムフォレストが特徴的なパターンを抽出するために有効であることがわかった。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
H27年度には、電子カルテのデータを、まず非匿名化DWH化し、次にオーダデータで既に運用しているのと同様の方法で匿名化を行った。このDWHを用い、記載情報の解析手法を開発するために、急性性腎障害(AKI)の一つである腎後性AKIを、オーダ情報および退院サマリの記載を連携することによって抽出可能か検討した。各サマリに対して潜在トピックモデルによって類似サマリを定義し、カテーテル実施履歴から腎後性の可能性データを抽出した。入院期間中にAKI初回判定されたデータに対し適用し、オーダ情報だけでは必要条件のみを満たし、退院サマリの評価を加えることで十分条件も満たしたデータとなることを確認した。本手法によって、AKI解析に必要な患者データ群を適切に抽出することが可能であることが確認できた。 H28年度は、電子カルテ匿名化DWHから退院サマリデータを対象とし、ComeJisyoV5-1を辞書データとしてmecabで形態素解析を実施、抽出した形態素を各サマリの出現順序数及び詳細品詞情報を保持させたまま、データベースとして構築した。これにより、記載内容を形態素に分解したうえで固有名詞をマスキングする最終的な匿名化DWH構築の基盤が整った。 H27年度には、オーダデータの匿名化DWHを用いて、オーダデータだけでどの程度正確な評価ができるかを、Association分析やクラスタ分析によって予備解析し、H28年度には、さらに決定木、ランダムフォレストなどの手法も追加し、確定病名毎に、共起する他の病名、検査項目、処方、処置・手術項目などの特徴的なパターンを抽出するための解析を行った。その結果、決定木、ランダムフォレストが特徴的なパターンを抽出するために、より有効であることがわかり、最終年度であるH29年度に向けての方向性を定めることができた。
|
今後の研究の推進方策 |
H29年度は、最終年度として、解析インフラとしては匿名化退院サマリDWHを固有名詞のマスキングまで含めて完成させる。解析については、H28年度までの結果を踏まえ、病院情報システムで対象病名の登録された1患者の1入院期間を1症例とし、それら各々につき、併存病名、検査、処方、処置、退院サマリの形態素を用いてランダムフォレスト、潜在的Dirichlet配分法などによる特徴抽出を行い、それぞれのパターンが病名の信頼度に対応しているかを臨床医に判断してもらう。また、病名の信頼度が高いと考えられるDPCのデータと比較して、信頼度を定量的に評価することを試みる。
|
次年度使用額が生じた理由 |
当初の計画では、電子カルテ記載情報についてはH27年度中に患者基本情報の部分を匿名化し、イベント情報を各患者の生年月日からの相対日付に置き換えたDWHを構築、さらに自由記載部分については、記載内容を形態素に分解したうえで固有名詞をマスキングして最終的な匿名化DWHとする予定であったが、記載内容の匿名化を行うシステムの設計に予想より時間がかかり、H27年度には実装が間に合わなかった。H28年度は、繰り延べた記載内容の匿名化を行うシステムの実装を行った。実装に際しては、研究代表者と研究分担者が設計のみ行い、実装作業は業者に発注する予定であったが、研究代表者と研究分担者ですべての実装作業が行えたため、その費用はH29年度に繰り越した。
|
次年度使用額の使用計画 |
H29年度は、解析用サーバーのメモリやストレジを増強して解析パフォーマンスを向上させることに使用する予定である。
|