2022 Fiscal Year Research-status Report
機械学習を用いた、住民健診における認知機能低下リスク予測モデルの確立
Project/Area Number |
22K10523
|
Research Institution | Japan Advanced Institute of Science and Technology |
Principal Investigator |
古川 健治 北陸先端科学技術大学院大学, 保健管理センター, 教授 (40324123)
|
Project Period (FY) |
2022-04-01 – 2027-03-31
|
Keywords | 認知症 / 機械学習 / 健診データ |
Outline of Annual Research Achievements |
石川県金沢市の認知症健診データ及び約50万人分の特定健診データを機械学習モデルで解析することにより、日本人の一般住民における認知症発症予測モデルを作成し、認知症発症以前に発症リスクが高い人を見つけ出して、個々のリスク因子の寄与度を算出し、認知症の発症予測、発症予防につなげることが本研究の目的である。 石川県金沢市の健診データを用いて研究を行うためには、金沢市医師会の倫理審査委員会で審査を受ける必要があり、同委員会で審査を受けて、研究実施が許可された。そして、2014年から2019年分の石川県金沢市の認知症健診データ、また、同時期の一般健診データを受領した。 これらのデータは、匿名化された生データであるため、データクリーニングが必要であった。データの数は膨大であるため、データクリーニングのためのプログラムの開発が必要となり、これを開発した。そして、実際の健診データにこのプラグラムを実行してデータのクリーニングを行った。 また、認知症健診及び一般健診はそれぞれ別の健診として行われており、それぞれ別の匿名化された健診データとして受領しているために、これらのデータの突合が必要であった。そのためこれらの健診データを突合するためのプログラムの開発が必要となり、これを開発した。そして、実際の健診データにこのプラグラムを実行して突合させることができた。 機械学習を行うためには、使用データの準備作業が必要であり、上記のように機械学習を行うためのデータの準備ができたため、解析できる環境が整った。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当該研究は、石川県金沢市の認知症健診データ及び約50万人分の特定健診データを機械学習モデルで解析することである。そのため、まずは当該の健診データを得ることが研究の第一歩であった。石川県金沢市の健診データを用いて研究を行うためには、金沢市医師会の倫理審査委員会で審査を受けて、データの使用が許可されるという手続きが必要であった。当該倫理審査委員会は、元々開催が不定期であり、コロナ禍ということもあって開催時期が遅れることも推測されたため、全てに先駆け、当該倫理審査委員会で審査を受けることを優先させた。その結果、遅滞なく研究に使用するためのデータを得ることができた。 研究に使用するための健診データは、既に匿名化された膨大な生データであったため、機械学習を行って解析するためには、使用データの準備作業が必要であった。一つ目は生データのクリーニングであり、不必要な部分を除去したり、使用不可能なデータの除去が必要であり、手作業では不可能であった。そのためのクリーニングのためのプログラムの開発に成功し、データのクリーニングが行えた。二つ目は、認知症健診データと一般健診データの突合作業であり、こちらの方もプログラムの開発に成功し、突合が行えた。以上のようにプログラムの開発により、機械学習を行うためのデータの準備ができたため、遅滞なく解析できる環境が整った。
|
Strategy for Future Research Activity |
石川県金沢市の認知症健診データ及び約50万人分の特定健診データを機械学習モデルで解析することにより、日本人の一般住民における認知症発症予測モデルを作成し、認知症発症以前に発症リスクが高い人を見つけ出して、個々のリスク因子の寄与度を算出し、認知症の発症予測、発症予防につなげることが本研究の目的である。 初年度は、必要な認知症健診データ及び、一般健診データを得て、機械学習を行うためのクリーニング、データの突合がなされ準備が整ったため、機械学習で解析できる環境が整った。 次年度は、実際の機械学習による解析を進める予定である。具体的には、認知症の発症予防につなげるため、未来の認知機能低下を予測するモデルの確立を行う。具体的な手法としては、一般化線形モデルや一般化加法モデルを用いて、回帰モデルによる、経年的な認知症健診データがある対象につき、認知機能を評価するミニメンタルステート検査の経年的な変化を引き起こす因子の解析を行う予定である。 また、認知症患者のスクリーニングを行うための、現在の認知機能の点数を予測するためのモデルを確立する。具体的な手法としては、一般化線形モデルや一般化加法モデルを用いて、分類モデルによる、認知症健診が行われた時点において認知機能が低下しているか、もしくは、低下していないかを予測するモデルの確立を行う予定である。
|
Causes of Carryover |
石川県金沢市の認知症健診データ及び約50万人分の特定健診データを機械学習モデルで解析することにより、日本人の一般住民における認知症発症予測モデルを作成し、認知症発症以前に発症リスクが高い人を見つけ出して、個々のリスク因子の寄与度を算出し、認知症の発症予測、発症予防につなげることが本研究の目的である。 初年度、機械学習を行うためのデータの準備として、データクリーニング及び健診データの突合が必要であった。これらのデータ準備に際し人件費が発生する予定であったが、コロナ禍で募集がうまくいかず、この問題は、データ準備作業のためのプログラミング開発により解決されたが。そのため、人件費は発生しなかったが、代わりに、プログラミング開発の参考とするための学会参加等の旅費を要した。また、bigデータを用いての機械学習のための設備を整備する予定であったが、データ準備の段階では、現状の設備で対応可能であった。次年度、解析の状況を踏まえて、機械学習のための設備を整備する予定である。
|