研究課題/領域番号 |
21H03164
|
研究機関 | 高知大学 |
研究代表者 |
奥原 義保 高知大学, 医学部, 特任教授 (40233473)
|
研究分担者 |
畠山 豊 高知大学, 教育研究部医療学系連携医学部門, 教授 (00376956)
兵頭 勇己 高知大学, 教育研究部医療学系連携医学部門, 助教 (50821964)
安井 繁宏 高知大学, 教育研究部医療学系連携医学部門, 助教 (00535346)
瀬尾 宏美 高知大学, 教育研究部医療学系医学教育部門, 教授 (80179316)
宮野 伊知郎 高知大学, 教育研究部医療学系連携医学部門, 准教授 (00437740)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
キーワード | 臨床推論推論 |
研究実績の概要 |
世界的な半導体不足による情報機器の製造・流通減少のため導入が遅延していたデータウェアハウス(DWH)用サーバの導入が完了した。ただし、納入完了が1月であったため、実際の解析については、現有するサーバを用い、小規模なデータを用いて試行的解析を昨年度に引き続き進めた。 昨年度は、対象を「めまい」を主訴とする症例に限定し、初診時記録に形態素解析を実施、名詞、動詞、形容詞を抽出、一方で可能性のある病名を列挙し、病名ごとの出現単語の頻度評価を行ったが、各単語の感度が低く、ナイーブベイズによる病名確定の成績も十分ではなかった。 異なる病名間の単語出現頻度を比較した結果、大きな差はなかったため、単純な単語出現頻度では、否定した症状も出現単語としてカウントしている可能性があると考え、否定の係り受けを評価した。さらに、各単語について、完全に一致するものに限らず、対象単語が含まれるものまで対象とし、 初診時主訴に「めまい」が含まれている患者の病名がめまいか、それ以外かという2クラス分類として定義した。 初診時記録を、万病辞書+GINZAでテキスト解析、名詞単語の出現頻度を集計、 出現頻度が多く各クラスでの出現比率の差が大きい単語を選択、患者ごとに、単語の否定、肯定の有無評価を行った。係り受け先の最後までに、 無し|なし|無い|ない|否定のいずれかが含まれる単語が途中で出現、または、最後の単語にこれらが含まれる助動詞がかかっている場合を否定と判定した。 各単語の出現比率の病名間での違いを検定、有意となった項目に性別、年齢を加えロジスティック回帰分析を行ったところ、 AUCが0.8864、VIFは全て2未満で多重共線性は起きていなかった。 同じ項目を使ったナイーブベイズでleave-one-out cross validationを実施すると正解率は0.8032となった。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
新型コロナ禍を原因の一つとする世界的な半導体不足による情報機器の製造・流通減少のため、本来なら一昨年度に完了していたはずのデータウェアハウス(DWH)用サーバの導入が大幅に遅延し、昨年度も前半は状況が改善せず、納入・設置が完了したのは2023年1月であった。このため、新サーバーの高い処理能力が使えず、知識データベース構築のための統計情報の作成や、登録された確定診断病名と共起する確率の高い症状、検査、処方、併存病名等の事象の組み合わせについて相関ルール解析の手法を適用して教師データの元データを作成する作業などが実施できず、現有するサーバによる小規模なデータを用いた知識データベース構築における有効な統計情報作成のための試行的解析や、有効な推論方法の検討などに限定せざるを得なかった。
|
今後の研究の推進方策 |
2023年度は、推論に必要な知識データベースに、来院患者の確定診断病名ごとの有病率、病名ごと状態ごとの感度、特異度、ある疾患(病名)が引き起こす可能性のある症状などの状態一覧、検査実施閾値、治療開始閾値などの統計情報を病院情報システムのデータから求め登録する。一方で、見逃した場合の危険度が高い病名も、可能性が低くても診断仮説に残すために、各病名の危険度を文献や臨床医の評価から得て登録する。 病院情報システムに登録された特定の確定診断病名と共起する確率の高い症状、検査、処方、併存病名等の事象の組み合わせについて相関ルール解析の手法を適用する。特定の確定診断病名を結論部とした場合に共起する事象の組み合わせを確率が大きい順に列挙した診療イベントパターン一覧を作成、その妥当性を臨床医が評価、臨床的に意味のないパターンを除外、意味のあるパターンを含む個々の症例につき事象すべてを病院情報システムのタイムスタンプ順に並べ、再度臨床医が選別し教師データとする。 推論システムでは、アブダクション推論とBayes推定を知識データベースに適用して、与えられた情報から鑑別疾患名リストの作成・更新および推論の次段階のための新たな質問事項の生成、推論過程や正解の理由の提示などを行う。検証過程では、教師データの情報を推論システムに段階的に入力し、各段階で推論システムから得られる鑑別疾患名や、鑑別疾患名絞り込みに必要な情報が教師データの次の段階に含まれているか検証、違いがあれば推論システムを修正する。 最終的に、臨床医に構築した推論システムを試行してもらい、システムの汎用性や実用性を評価する。
|