2017 Fiscal Year Research-status Report
電子的診療情報からの高次元特徴量による患者状態の表現と機械学習の適用に関する研究
Project/Area Number |
16K09161
|
Research Institution | The University of Tokyo |
Principal Investigator |
河添 悦昌 東京大学, 医学部附属病院, 講師 (10621477)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | EHR Phenotyping |
Outline of Annual Research Achievements |
電子的診療データを活用するために複数種類の診療情報を用いて特定の疾患を同定し抽出するEHR Phenotypingは重要な技術となる。 本研究は患者の疾患や状態を高次元の特徴ベクトルによって表現し、機械学習の手法を用いて精度の高いEHR Phenotyping を行うアル ゴリズムの開発を目指す。H28年度は、東京大学医学部附属病院の電子カルテシステムとSS-MIX2標準化ストレージから、構造化診 療データ(患者基本情報、診断病名、投薬情報、検体検査結果等、バイタルサイン)と非構化診療データ(放射線読影レポート、病理レポートなど各種検査レポート)を抽出し実験のためのデータベースを構築した。このデータベースから一定の基準を満たす約10万症例を抽出し任意のがんの有無を識別するアルゴリズムを開発し評価を行った。さらなる精度向上を目指ざし、H29年度は 1) EHRデータの緻密化手法の開発、2)オントロジーと自己符号化器用いた次元削減手法の開発、に取り組んだ。1)に関して、検体検査結果の欠損を精度よく推定することを目的とし、状態空間モデル(SSM)とニューラルネットワーク(NN)による方法を比較した。ベースラインとして提示した1次線形補間の方法と比べSSMは推定精度が悪く、NNを用いた方法は推定精度が良かった。NNを用いた方法間の比較では、ConvolutionとDeconvolutionを使ったモデルは全結合によるネットワークを使ったモデルよりも推定精度が良く、また多系列のモデルにすることの効果を認めた。2) に関しては、さらなる検討が必要であり、引き続き課題として継続する。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
H30年度において、当初予定していた2) オントロジーと自己符号化器を用いた次元削減の方法について更なる検討が必要であるため、概ね順調と評価した。
|
Strategy for Future Research Activity |
H30年度は、オントロジーと自己符号化器を用いた次元削減の方法、欠損値を補完した上でのモデルの精度の比較を含め、より精度の高いモデルの開発を目指す。
|
Causes of Carryover |
H29年度に海外学会に参加するための旅費の見積もりを約300千円としていたが、実支出額が約250千円であったため、次年度使用額が生じた。この助成金は、H30年度の学会参加旅費もしくは書籍購入費として使用することを計画する。
|