2017 年度実施状況報告書

電子的診療情報からの高次元特徴量による患者状態の表現と機械学習の適用に関する研究

研究課題

研究課題/領域番号	16K09161
研究機関	東京大学
研究代表者	河添悦昌東京大学, 医学部附属病院, 講師 (10621477)
研究期間 (年度)	2016-04-01 – 2019-03-31
キーワード	EHR Phenotyping
研究実績の概要	電子的診療データを活用するために複数種類の診療情報を用いて特定の疾患を同定し抽出するEHR Phenotypingは重要な技術となる。本研究は患者の疾患や状態を高次元の特徴ベクトルによって表現し、機械学習の手法を用いて精度の高いEHR Phenotyping を行うアルゴリズムの開発を目指す。H28年度は、東京大学医学部附属病院の電子カルテシステムとSS-MIX2標準化ストレージから、構造化診療データ(患者基本情報、診断病名、投薬情報、検体検査結果等、バイタルサイン)と非構化診療データ(放射線読影レポート、病理レポートなど各種検査レポート)を抽出し実験のためのデータベースを構築した。このデータベースから一定の基準を満たす約10万症例を抽出し任意のがんの有無を識別するアルゴリズムを開発し評価を行った。さらなる精度向上を目指ざし、H29年度は 1) EHRデータの緻密化手法の開発、2)オントロジーと自己符号化器用いた次元削減手法の開発、に取り組んだ。1)に関して、検体検査結果の欠損を精度よく推定することを目的とし、状態空間モデル(SSM)とニューラルネットワーク(NN)による方法を比較した。ベースラインとして提示した1次線形補間の方法と比べSSMは推定精度が悪く、NNを用いた方法は推定精度が良かった。NNを用いた方法間の比較では、ConvolutionとDeconvolutionを使ったモデルは全結合によるネットワークを使ったモデルよりも推定精度が良く、また多系列のモデルにすることの効果を認めた。2) に関しては、さらなる検討が必要であり、引き続き課題として継続する。
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由 H30年度において、当初予定していた2) オントロジーと自己符号化器を用いた次元削減の方法について更なる検討が必要であるため、概ね順調と評価した。
今後の研究の推進方策	H30年度は、オントロジーと自己符号化器を用いた次元削減の方法、欠損値を補完した上でのモデルの精度の比較を含め、より精度の高いモデルの開発を目指す。
次年度使用額が生じた理由	H29年度に海外学会に参加するための旅費の見積もりを約300千円としていたが、実支出額が約250千円であったため、次年度使用額が生じた。この助成金は、H30年度の学会参加旅費もしくは書籍購入費として使用することを計画する。

研究成果
(9件)

すべて 2018 2017 その他

すべて雑誌論文 (4件) (うち査読あり 4件、オープンアクセス 2件) 学会発表 (2件) 図書 (2件) 備考 (1件)

[雑誌論文] Effects of implementing tree model of diagnosis into a Bayesian diagnostic inference system2017
- 著者名/発表者名
  Satoshi Iwai, Yoshimasa Kawazoe, Takeshi Imai, Kazuhiko Ohe
- 雑誌名
  
  Stud Health Technol Inform.
  
  巻: 245 ページ: 882-886
- 査読あり / オープンアクセス
[雑誌論文] The impact of “possible patients” on phenotyping algorithms: Electronic phenotype algorithms can only be reproduced by sharing detailed annotation criteria2017
- 著者名/発表者名
  Rina Kagawa, Yoshimasa Kawazoe, Emiko Shinohara, Takeshi Imai, Kazuhiko Ohe
- 雑誌名
  
  Stud Health Technol Inform.
  
  巻: 245 ページ: 432-436
- 査読あり / オープンアクセス
[雑誌論文] 疾患横断的なe-phenotyping手法開発を目的とした各疾患の特徴の検討2017
- 著者名/発表者名
  香川璃奈, 河添悦昌, 篠原恵美子, 今井健, 大江和彦
- 雑誌名
  
  医療情報学
  
  巻: 37 ページ: 754-759
- 査読あり
[雑誌論文] 状態空間モデルと深層ニューラルネットワークによる検体検査結果の欠損値推定精度の比較2017
- 著者名/発表者名
  河添悦昌, 倉沢央, 岩井聡, 香川璃奈, 大江和彦
- 雑誌名
  
  医療情報学
  
  巻: 37 ページ: 820-824
- 査読あり
[学会発表] 状態空間モデルと深層ニューラルネットワークによる検体検査結果の欠損値推定精度の比較2017
- 著者名/発表者名
  河添悦昌, 倉沢央, 岩井聡, 香川璃奈, 大江和彦
- 学会等名
  第37回医療情報学連合大会
[学会発表] 診療情報によるPhenotypingの現状・限界2017
- 著者名/発表者名
  河添悦昌, 香川璃奈, 今井健, 大江和彦
- 学会等名
  第37回医療情報学連合大会シンポジウム
[図書] 腎臓内科・泌尿器科2018
- 著者名/発表者名
  河添悦昌, 大江和彦
- 総ページ数
  5
- 出版者
  科学評論社
[図書] 医歯薬出版株式会社2017
- 著者名/発表者名
  河添悦昌
- 総ページ数
  5
- 出版者
  医療における人工知能技術の応用
[備考] 東京大学大学院医学系研究科社会医学専攻医療情報学分野
- URL
  http://www.m.u-tokyo.ac.jp/medinfo/?page_id=182

2017 年度 実施状況報告書

電子的診療情報からの高次元特徴量による患者状態の表現と機械学習の適用に関する研究

研究代表者

河添 悦昌 東京大学, 医学部附属病院, 講師 (10621477)

現在までの達成度 (区分)

理由

研究成果

[雑誌論文] Effects of implementing tree model of diagnosis into a Bayesian diagnostic inference system2017

著者名/発表者名

雑誌名

[雑誌論文] The impact of “possible patients” on phenotyping algorithms: Electronic phenotype algorithms can only be reproduced by sharing detailed annotation criteria2017

著者名/発表者名

雑誌名

[雑誌論文] 疾患横断的なe-phenotyping手法開発を目的とした各疾患の特徴の検討2017

著者名/発表者名

雑誌名

[雑誌論文] 状態空間モデルと深層ニューラルネットワークによる検体検査結果の欠損値推定精度の比較2017

著者名/発表者名

雑誌名

[学会発表] 状態空間モデルと深層ニューラルネットワークによる検体検査結果の欠損値推定精度の比較2017

著者名/発表者名

学会等名

[学会発表] 診療情報によるPhenotypingの現状・限界2017

著者名/発表者名

学会等名

[図書] 腎臓内科・泌尿器科2018

著者名/発表者名

総ページ数

出版者

[図書] 医歯薬出版株式会社2017

著者名/発表者名

総ページ数

出版者

[備考] 東京大学大学院医学系研究科 社会医学専攻 医療情報学分野

URL

2017 年度実施状況報告書

河添悦昌東京大学, 医学部附属病院, 講師 (10621477)

[備考] 東京大学大学院医学系研究科社会医学専攻医療情報学分野