• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2019 Fiscal Year Research-status Report

疫学データに対する人工知能技術適用の枠組みの検証と提案

Research Project

Project/Area Number 19K19433
Research InstitutionUniversity of Yamanashi

Principal Investigator

大岡 忠生  山梨大学, 大学院総合研究部, 特任助教 (40803987)

Project Period (FY) 2019-04-01 – 2021-03-31
Keywords疾患予測モデル
Outline of Annual Research Achievements

研究協力施設の健康診断データを用いて、5年以内の糖尿病発症を予測する複数のモデルを作成した。そのうち、産業保健分野や健康診断施設への適用が可能と考えられる、定期健康診断の項目のみから構成される説明変数から糖尿病の発症を予測するモデルを作成した。モデルの作成時には、昨年度に構築したランダムフォレストだけでなく、スパースロジスティックモデルも使用した。単年度のみのデータを用いるのみならず、3年連続の健康データを用いることで、より高い精度のモデル構築を目指した。3年連続の健康データではそれぞれ単年度のデータのみならずその間の変化量、更には値や変化量同士の交互作用をも変数に含めることで、10000弱の説明変数からアウトカムを予測するモデルも作成した。これは、既存のリスクモデル研究で用いられていた回帰モデルをそのまま用いることでは達成できず、機械学習モデルを用いるからこそ達成することが出来た予測でもある。今後の研究展開として、DeepLearningでの精度確認を行ったのちに、RandomForest、スパースロジスティック、DeepLearningを用いて作成したモデルが、他の研究協力施設での健康診断データを用いたとしても良好な精度での予測が保たれるかどうかを検討し、精度面と予測因子解釈面では別々のモデルを活用する事によって、予測能の向上と機械学習を用いた適切な因子同定の双方を達成する事を目指す。また、これらのモデルが実際の保健現場で用いることが出来るかについて、研究協力機関とのディスカッションを通して施設群が実際に活用できるプログラムの作成も検討していく。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

研究協力施設における健康診断データは適切にクリーニングされ、Random Forestや他の手法(スパースロジスティック)を用いて、既存のリスクモデル研究では作成されなかったモデルの構築を行うとともに、Variable ImportanceやGraphical Lasso等を用いた網羅的な予測因子の探索を行うことが出来た。当初の予定通りの進捗で研究は進んでいる。

Strategy for Future Research Activity

DeepLearningでの精度確認を行ったのちに、RandomForest、スパースロジスティック、DeepLearningを用いて作成したモデルが、他の研究協力施設での健康診断データを用いたとしても良好な精度での予測が保たれるかどうかを検討し、精度面と予測因子解釈面では別々のモデルを活用する事によって、予測能の向上と機械学習を用いた適切な因子同定の双方を達成する事を目指す。また、これらのモデルが実際の保健現場で用いることが出来るかについて、研究協力機関とのディスカッションを通して、施設が実際に活用できるプログラム作成を検討していく。

Causes of Carryover

健康診断施設から受け取った健康データのクリーニングが複雑である事より、研究者が自ら行ったため、データクリーニングに係る人件費がかからなかった。一方で、新たな機械学習手法を検討・実装する際の調査や書類、解析に必要となる電子機器、専門家との相談等に係る出費が、当初の予定以上に必要となっているため、差額はこれらの費用に充足する予定である。

  • Research Products

    (3 results)

All 2020 2019

All Presentation (3 results)

  • [Presentation] 機械学習技術を用いて健康診断結果から糖尿病発症を予測する方法の検討2020

    • Author(s)
      大岡忠生、横道洋司、山縣然太朗
    • Organizer
      第30回日本疫学会学術総会
  • [Presentation] 予防医療分野における疫学データへの機械学習技術活用について ~スパースモデリングを活用した糖尿病発症予測と予測因子探索~2020

    • Author(s)
      大岡忠生、日野英逸、横道洋司、山縣然太朗
    • Organizer
      統計数理研究所共同利用研究集会 ~統計的機械学習の新展開~
  • [Presentation] 人工知能技術を活用した2型糖尿病のリスク予測手法の検証と疾患予測因子の探索2019

    • Author(s)
      大岡忠生、横道洋司、山縣然太朗
    • Organizer
      第78回日本公衆衛生学会総会

URL: 

Published: 2021-01-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi