2017 Fiscal Year Annual Research Report
Establishing prediction models for onset of chronic diseases using medical receipt database
Project/Area Number |
17H06629
|
Research Institution | The University of Tokyo |
Principal Investigator |
大野 幸子 東京大学, 大学院医学系研究科(医学部), 特任助教 (20797237)
|
Project Period (FY) |
2017-08-25 – 2019-03-31
|
Keywords | 機械学習 / 疾患発症予測 |
Outline of Annual Research Achievements |
生活習慣病を始めとする慢性疾患では、その発症や重症化の危険性がある集団を早期に特定し、行政や保険者が対策を講じる事が公衆衛生の観点から重要である。既存の研究から糖尿病のリスクスコアなどが知られているものの、予測可能時期は疾患の発症や重症化と近接しており、早期介入は困難である。近年急速に発達してきた機械学習は膨大なデータを分析し、有用な規則や判断基準などから、アルゴリズムを発展させる手法である。その予測能力から医学領域では、疾患発症・重症化の早期シグナル検出への応用が期待されているものの、研究利用可能な医療データベースの不足、機械学習の手法に精通する臨床研究者の不足から充分な研究がなされていない。そこで本研究では健康診断のデータを含む医療ビッグデータに機械学習を適用し、種々の慢性疾患発症・重症化をより早期に予測するモデルを構築し、疾患発症・重症化リスクのある集団の早期特定に寄与することを目的とした。 平成29年度はSQL 言語を用いて日本医療センターより取得したレセプト・健診データの整形、結合を行い、甲状腺機能亢進症の予測モデル構築に必要なテーブル作成を行った。データに機械学習の各手法を適応し、Random forestでは重症バセドウ病の新規発症を陽性的中率100%、特異度83%で予測するモデルを構築した。今後は他の機械学習手法の適応および各種パラメーターの調整により更なる予測パフォーマンスの向上を目指すとともに、他の慢性疾患の予測モデルの開発を同様に進めていく。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
取得したデータ内に10年以上の特定健診データを持つものが少なく、対象疾患の変更や予測に用いる変数の再検討を行い、テーブル作成プログラム及び予測プログラムの修正を行っているため。
|
Strategy for Future Research Activity |
平成30年度は引き続き甲状腺疾患、及び他の疾患の発症を予測するモデルを構築し、予測パフォーマンスの向上を目指す。予測精度の高いモデルが得られた際には、臨床応用について検討する。
|