2018 Fiscal Year Annual Research Report
Buildling of work-flow to develop machine learning model for prediction of Hypertensive disorders of pregnancy (HDP)
Project/Area Number |
16K20899
|
Research Institution | Tohoku University |
Principal Investigator |
水野 聖士 東北大学, 東北メディカル・メガバンク機構, 助教 (80646795)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | バイオインフォマティクス / 機械学習 / フェノタイピング / 早期診断支援 / 深層学習 / 産科 / 妊娠高血圧症候群 / HDP |
Outline of Annual Research Achievements |
本年度は、最終年度として以下の成果を得た。初年度の平成28年度に構築した、妊娠高血圧症候群(HDP)の早期診断支援のための機械学習での正解ラベルを取得するための、HDPの病態分類を行うフェノタイピングアルゴリズムについて、HDPの新しい診断基準に基づくアルゴリズムを開発した。病態分類の基準は、血圧データなどの構造化データに加え、問診・所見データなどの非構造化データも使用し、高精度なフェノタイピングアルゴリズムを目指した。開発したアルゴリズムは、これまで開発してきた旧診断基準に従うアルゴリズムも含め、東北メディカル・メガバンク計画三世代コホート調査でリクルートされた研究対象者に適用するとともに、医師の診断を正解とした精度検証を行い、二つのアルゴリズムともに高い陽性反応的中率を示すことを確かめた。 さらに、平成28年度、平成29年度に検討を行ったHDPの早期診断支援のための機械学習モデルの構築について、さらに詳細な検討を行い、欠損データ解析、変数選択などを含む前処理や、深層学習を含む機械学習モデル構築の適切な手法を探索するとともに、機械学習モデルの解釈の方法を検討した。検討の結果得られた手法で、フェノタイピングの結果を正解ラベルとし、三世代コホート調査で収集された妊婦の生活習慣等のデータを入力にとる機械学習モデルの構築を行った。構築した機械学習モデルでは、HDP患者の高精度な予測が可能であることを示したとともに、学習に重要な変数セットとそれらの重要度のリストを得た。 以上より、本研究では高精度にHDPの病態分類を行うフェノタイピングアルゴリズムと、その結果を正解ラベルとした、HDPの高精度な予測が可能な機械学習モデルを得た。今後は、HDPの病型の予測を含めた、生活習慣・ゲノム情報・医療情報など多種の情報を入力にとる詳細な、早期診断支援のための機械学習の検討を行う。
|