研究課題/領域番号 |
21H03164
|
研究機関 | 高知大学 |
研究代表者 |
奥原 義保 高知大学, 医学部, 特任教授 (40233473)
|
研究分担者 |
畠山 豊 高知大学, 教育研究部医療学系連携医学部門, 教授 (00376956)
宮野 伊知郎 高知大学, 教育研究部医療学系連携医学部門, 准教授 (00437740)
安井 繁宏 高知大学, 教育研究部医療学系連携医学部門, 助教 (00535346)
兵頭 勇己 高知大学, 教育研究部医療学系連携医学部門, 助教 (50821964)
瀬尾 宏美 高知大学, 教育研究部医療学系医学教育部門, 教授 (80179316)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
キーワード | 臨床推論 / real-world data / 知識データベース |
研究実績の概要 |
今年度は、高知大学医学部附属病院の電子カルテ記載部分から抽出したキーワードを使用するため、自由記載テキスト情報の匿名データウェアハウス(DWH)化を新規サーバーと仮想化システムの導入によって実施する予定であったが、新型コロナウィルス感染症蔓延の影響で情報機器の製造・流通が減少したため、導入予定のサーバ納入が遅延し、年度内の導入が実現しなかった。このため、現有するサーバーを用い、小規模なデータを用いて匿名化DWHおよび知識データベースの設計・実装のための試行的解析を進めた。 このため、対象を「めまい」を主訴とする症例に限定し、初診時記録を対象に形態素解析を実施、名詞、動詞、形容詞を抽出し、どの様な文書にも出現するstopword等の単語を除外してデータベース化した。一方で可能性のある病名を列挙し、各病名ごとの出現単語の頻度評価を行った。 まず、各病名に対する各単語の感度、特異度を計算して評価、さらにそれらの結果を用いてナイーブベイズによる病名確定の確率を評価した。その結果、各単語の感度が低く、ナイーブベイズによる病名確定の成績も十分ではなかった。このことは、同じ概念が異なる表現となっている場合の整理などの必要性を示唆している。 また、「めまい」を主訴とする症例に限定したデータベースを用い、Latent Dirichlet Allocation(LDA)解析の手法を適用して、可能性のある病名に対応するトピックスとそのトピックを特徴づける単語の出現確率分布が得られるかを検証した。 これらの解析の結果、stopwordの適切な除外が必須であることや粒度の粗いあいまいな病名の除外も必要であることなどがわかった。そうした前処理を行ったデータに対する結果では、各トピックすなわち各病名候補に特徴的な単語を抽出でき、同じ概念が異なる表現となっている場合の整理に活用できる可能性が見いだせた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
今年度は、高知大学医学部附属病院の電子カルテ記載部分から抽出したキーワードを使用するため、自由記載テキスト情報の匿名データウェアハウス(DWH)化を新規サーバーと仮想化システムの導入によって実施する予定であったが、新型コロナウィルス感染症蔓延の影響で情報機器の製造・流通が減少したため、導入予定のサーバ納入が遅延し、年度内の導入が実現しなかった。このため、現有するサーバーを用い、小規模なデータを用いて匿名化DWHおよび知識データベースの設計・実装のための試行的解析に限定せざるを得なかった。
|
今後の研究の推進方策 |
来年度は電子カルテ記載部分から抽出したキーワードを使用するため、自由記載テキスト情報の匿名データウェアハウス(DWH)化を新規サーバーと仮想化システムの導入を完成させ、来院患者の確定診断病名ごとの有病率、病名ごと状態ごとの感度、特異度、ある疾患(病名)が引き起こす可能性のある症状などの状態一覧、検査実施閾値、治療開始閾値など知識データベース構築のための統計情報を作成する。また、病院情報システムに登録された特定の確定診断病名と共起する確率の高い症状、検査、処方、併存病名等の事象の組み合わせについて相関ルール解析の手法を適用し、特定の確定診断病名を結論部とした場合に共起する事象の組み合わせを確率が大きい順に列挙した診療イベントパターン一覧を作成、その妥当性を臨床医が評価、臨床的に意味のないパターンを除外、意味のあるパターンを含む個々の症例につき事象すべてを電子カルテのタイムスタンプ順に並べ、再度臨床医が選別し教師データとする。
|