研究課題/領域番号 |
20K21715
|
研究種目 |
挑戦的研究(萌芽)
|
配分区分 | 基金 |
審査区分 |
中区分58:社会医学、看護学およびその関連分野
|
研究機関 | 高知大学 |
研究代表者 |
奥原 義保 高知大学, 医学部, 特任教授 (40233473)
|
研究分担者 |
畠山 豊 高知大学, 教育研究部医療学系連携医学部門, 教授 (00376956)
片岡 浩巳 川崎医療福祉大学, 医療技術学部, 教授 (80398049)
久原 太助 高知大学, 医学部附属病院, 臨床検査技師 (80457407)
堀野 太郎 高知大学, 教育研究部医療学系臨床医学部門, 准教授 (90448382)
|
研究期間 (年度) |
2020-07-30 – 2024-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
6,240千円 (直接経費: 4,800千円、間接経費: 1,440千円)
2022年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2021年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2020年度: 4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
|
キーワード | Real World Data / 検査値推定 / 蛋白電気泳動 / 欠測値推定 / 機械学習 / 知識データベース / 臨床検査 / 臨床医の集団知 |
研究開始時の研究の概要 |
電子カルテなど実診療に基づくReal World Data活用が期待されているが、その際、検査データにしばしば存在する欠測が大きな問題となり、多数施設のデータを統合してもビッグデータには成り得ない。欠測は、実臨床においては、異常を疑う情報が無ければ検査を行わないという医師の臨床判断の必然的な結果である。 本研究では、検査実施に関して「異常の疑いのない検査は実施せず、異常が疑われる検査のみを実施する」という新しい基準を設け、欠測値の新しい推定方法を検証するため、以下を明らかにする。 A) 医師の臨床判断に影響する因子は何か? B) 医師の臨床判断に含まれる因子が与えられれば、欠測値は正しく推定できるか?
|
研究実績の概要 |
蛋白電気泳動波形と生化学・血液検査結果を用いて、2クラス判別ではなく定量的に検査値を推定するため3つの方法を検討した。1.波形のピーク位置とピーク面積を計算、ピークの面積と検査値との相関係数が最も大きいピークをその検査に対応するピークと考え、その面積から検査値を推定する。ある点(移動度)の両側決められた幅の中で、その点が最大値であれば局所的ピークとし、幅の中の要素の値すべてからその点の標準偏差を求め、波形のピーク位置とピーク面積を計算した。2.複数のGauss型波形の存在を仮定しGauss-Newton法により求めたピーク位置とピークの面積を用い、1.と同様の方法で検査値を推定する。 3.各点における振幅の値を説明変数、検査値を目的変数とした重回帰モデルにより検査値を推定する。 アルブミン,CRP,HDL,LDL,AST,コリンエステラーゼ,PLT,HbA1c,BUNを対象に評価した結果、重回帰分析が最も良いモデルであったが、自由度で調整した決定係数が最も大きかったアルブミンでも0.8187であり、ASTの -0.02202などモデルの評価が低い検査もあり、十分な性能とは言い難かった。 このため、検査結果の定量的推定については保留し、昨年度進めた勾配ブースティング決定木(GBDT)による2クラス分類の予測モデルを用い、蛋白泳動は測定されたが生化学・血液検査に欠測がある場合の検査値を推定、欠測している検査の推定値が基準値内に存在する割合が生化学・血液検査がオーダーされた場合と違いがあるか評価した。その結果、WBCの3.2(基準値内に存在する割合の比)からALBの1.11、ASTの0.53などが混在し、「臨床医が異常有りと推論しなかったのでオーダーしなかった。」という仮説が単純には成り立っていないことが示された。原因として、ルーチン的に行う検査の存在などが考えられる。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
4: 遅れている
理由
2022年度は、データベース化した蛋白電気泳動検査結果に対応する患者の電子カルテ自由記載情報を抽出・特徴量化したデータを、新しく設置・拡張するサーバーでデータウェアハウス(DWH)化する予定であったが、新型コロナウィルス感染症の影響等で情報機器の製造・流通が減少したため、導入予定のサーバ納入が遅延し、2023年1月に導入完了したため本格的な解析に間に合わなかった。このため、電子カルテ情報のDWH化は保留し、すでにDWH化した蛋白電気泳動検査結果と、オーダされた生化学・血液検査結果だけを用いる解析に限定せざるを得なかった。
|
今後の研究の推進方策 |
2023年度は、勾配ブースティング決定木(GBDT)による各検査の予測モデルの結果と患者の電子カルテの自由記載情報を匿名化したデータベースの情報を考慮した予測により、仮説の検証を行う。具体的には、まず、電子カルテの自由記載情報から抽出した単語と、実施している検査項目に対してassociation分析を行い、確信度が大きい組み合わせを求め、患者の特定の検査実施に結びつく単語の抽出を試みる。それらの情報と検査が欠測しているという情報、検査がルーチン的に行われるものかどうかなどの情報から検査値が基準値の範囲内か否かの推測を行い、蛋白電気泳動の波形に勾配ブースティング決定木(GBDT)による予測モデルを適用した推測との一致度を評価することにより仮説の検証を行う。また、ディープニューラルネットワーク(DNN:Deep Neural Network)で、出力の判定をクラス分け分類ではなく、出力層のノード数を1としSoftmax活性化関数を適用せずに実数値として評価する回帰DNNモデルを適用し、検査結果が基準値内か否かのクラス分類だけではなく、実数値として推定することも試み、仮説の検証に適用する。
|