2022 Fiscal Year Research-status Report
医師の臨床判断を考慮した実診療データにおける欠測値の新しい推定方法
Project/Area Number |
20K21715
|
Research Institution | Kochi University |
Principal Investigator |
奥原 義保 高知大学, 医学部, 特任教授 (40233473)
|
Co-Investigator(Kenkyū-buntansha) |
畠山 豊 高知大学, 教育研究部医療学系連携医学部門, 教授 (00376956)
片岡 浩巳 川崎医療福祉大学, 医療技術学部, 教授 (80398049)
久原 太助 高知大学, 医学部附属病院, 臨床検査技師 (80457407)
堀野 太郎 高知大学, 教育研究部医療学系臨床医学部門, 准教授 (90448382)
|
Project Period (FY) |
2020-07-30 – 2024-03-31
|
Keywords | Real World Data / 検査値推定 / 蛋白電気泳動 |
Outline of Annual Research Achievements |
蛋白電気泳動波形と生化学・血液検査結果を用いて、2クラス判別ではなく定量的に検査値を推定するため3つの方法を検討した。1.波形のピーク位置とピーク面積を計算、ピークの面積と検査値との相関係数が最も大きいピークをその検査に対応するピークと考え、その面積から検査値を推定する。ある点(移動度)の両側決められた幅の中で、その点が最大値であれば局所的ピークとし、幅の中の要素の値すべてからその点の標準偏差を求め、波形のピーク位置とピーク面積を計算した。2.複数のGauss型波形の存在を仮定しGauss-Newton法により求めたピーク位置とピークの面積を用い、1.と同様の方法で検査値を推定する。 3.各点における振幅の値を説明変数、検査値を目的変数とした重回帰モデルにより検査値を推定する。 アルブミン,CRP,HDL,LDL,AST,コリンエステラーゼ,PLT,HbA1c,BUNを対象に評価した結果、重回帰分析が最も良いモデルであったが、自由度で調整した決定係数が最も大きかったアルブミンでも0.8187であり、ASTの -0.02202などモデルの評価が低い検査もあり、十分な性能とは言い難かった。 このため、検査結果の定量的推定については保留し、昨年度進めた勾配ブースティング決定木(GBDT)による2クラス分類の予測モデルを用い、蛋白泳動は測定されたが生化学・血液検査に欠測がある場合の検査値を推定、欠測している検査の推定値が基準値内に存在する割合が生化学・血液検査がオーダーされた場合と違いがあるか評価した。その結果、WBCの3.2(基準値内に存在する割合の比)からALBの1.11、ASTの0.53などが混在し、「臨床医が異常有りと推論しなかったのでオーダーしなかった。」という仮説が単純には成り立っていないことが示された。原因として、ルーチン的に行う検査の存在などが考えられる。
|
Current Status of Research Progress |
Current Status of Research Progress
4: Progress in research has been delayed.
Reason
2022年度は、データベース化した蛋白電気泳動検査結果に対応する患者の電子カルテ自由記載情報を抽出・特徴量化したデータを、新しく設置・拡張するサーバーでデータウェアハウス(DWH)化する予定であったが、新型コロナウィルス感染症の影響等で情報機器の製造・流通が減少したため、導入予定のサーバ納入が遅延し、2023年1月に導入完了したため本格的な解析に間に合わなかった。このため、電子カルテ情報のDWH化は保留し、すでにDWH化した蛋白電気泳動検査結果と、オーダされた生化学・血液検査結果だけを用いる解析に限定せざるを得なかった。
|
Strategy for Future Research Activity |
2023年度は、勾配ブースティング決定木(GBDT)による各検査の予測モデルの結果と患者の電子カルテの自由記載情報を匿名化したデータベースの情報を考慮した予測により、仮説の検証を行う。具体的には、まず、電子カルテの自由記載情報から抽出した単語と、実施している検査項目に対してassociation分析を行い、確信度が大きい組み合わせを求め、患者の特定の検査実施に結びつく単語の抽出を試みる。それらの情報と検査が欠測しているという情報、検査がルーチン的に行われるものかどうかなどの情報から検査値が基準値の範囲内か否かの推測を行い、蛋白電気泳動の波形に勾配ブースティング決定木(GBDT)による予測モデルを適用した推測との一致度を評価することにより仮説の検証を行う。また、ディープニューラルネットワーク(DNN:Deep Neural Network)で、出力の判定をクラス分け分類ではなく、出力層のノード数を1としSoftmax活性化関数を適用せずに実数値として評価する回帰DNNモデルを適用し、検査結果が基準値内か否かのクラス分類だけではなく、実数値として推定することも試み、仮説の検証に適用する。
|
Causes of Carryover |
2022年度は、データベース化した蛋白電気泳動検査結果に対応する患者の電子カルテ自由記載情報を抽出・特徴量化したデータを、新しく設置・拡張するサーバーでデータウェアハウス(DWH)化する予定であったが、新型コロナウィルス感染症の影響等で情報機器の製造・流通が減少したため、導入予定のサーバ納入が遅延し、2023年1月に導入完了した。このため、解析が当初計画した予定どおりに進まず、結果の発表に至らなかったため学会参加の旅費や論文作成のために予定していた予算の執行がなかった。2023年度は、結果の発表のための学会参加の旅費や論文作成のための英文校正や投稿料などに使用する予定である。
|