2022 Fiscal Year Research-status Report
70万人、43年の大規模健診データによる心血管病発症AI予測モデルの構築と実装
Project/Area Number |
21K08034
|
Research Institution | Kagoshima University |
Principal Investigator |
川添 晋 鹿児島大学, 医歯学総合研究科, 特任講師 (00810201)
|
Co-Investigator(Kenkyū-buntansha) |
窪薗 琢郎 鹿児島大学, 医歯学域医学系, 講師 (00598013)
大石 充 鹿児島大学, 医歯学域医学系, 教授 (50335345)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Keywords | AI / 予測モデル / 健診データ |
Outline of Annual Research Achievements |
健診データの可視化とAI適用への前処理を順次行ってきた。具体的には、データエラーやノイズ、欠損値に対する補完やクレンジング、既存の統計学的解析手法によるデータ傾向の調査、データの変換(正規化、汎化など)を実施し、AI解析の実施に耐えうるデータへの整形、リスク因子の年次変動を加味した変数の合成などを順次行ってきた。続いて、LAMPおよび複数の機械学習モデルの作成を行った。統計的に有意な相互因子を発見可能なLAMPを適用し、ハイパーパラメータのチューニングを行い、機械学習モデルを適用(ランダムフォレスト、XGBoosting、ロジスティック回帰、ニューラルネットワーク、サポートベクトルマシン、他)を行った。アウトカムとして現時点では高血圧、慢性腎臓病、メタボリックシンドローム、動脈硬化(baPWV高値)について検討を行っている。ズーム等の遠隔システムを利用して、研究協力者であるヒューマノーム研究所の瀬々氏、寺田氏と連携しながら、上記結果の比較による予測精度の検証を行い、医学的な見地からの解釈を検討するために、データの確認、特徴量選択の適正化、アルゴリズムの確認などについて検討を繰り返している段階である。臨床的に実装可能な状態を目指す作業を行っている。また、研究成果について発表可能な段階にきていると思われる内容については国内外の複数の学会で成果の発表を行い、全国の機械学習に関心をもつ有志との勉強会等においてもブラッシュアップをはかっている。また論文化の準備も進めているところである。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
鹿児島厚生連病院の健康診断データを用いて、まずは高血圧発症についての予測モデルを作成している。作成は研究協力者であるヒューマノーム研究所の瀬々氏、寺田氏の両氏と共同で行っている。現時点では、単年度、および2年連続のデータを用いて5年後の発症を予測するモデルを、複数の機械学習アルゴリズム(ランダムフォレスト、XGBoost、ロジスティック回帰、ニューラルネットワークなど)を用いて構築し、AUCにして0.85~0.92程度の識別精度が達成されている。特徴量エンジニアリングおよびハイパーパラメータのチューニングによりさらに識別能の向上をはかっているところである。さらに、慢性腎臓病、動脈硬化(動脈スティフネス上昇、頸動脈プラーク)についても同様の予測モデルを構築を進めているところである。 上記の研究成果の一部については、すでに国内外の学会にて発表済みであり(日本心臓病学会、日本循環器学会、アメリカ心臓病学会、ヨーロッパ心臓病学会、日本疫学会など)、並行して論文化も進めているところである。
|
Strategy for Future Research Activity |
複数の機械学習モデルについて、予測精度の比較・検証を引き続き行う。医学的な見地からの解釈を検討し、臨床的に実装可能な状態を目指す。 機械学習予測モデルが完成し次第、実装に向けての独立コホートを用いた検証を予定している。鹿児島県内の他の大規模健診センターデータへの適用、垂水市コホート研究への適用と精度検証を予定している。短期的には疾患予測モデルによる疾患発症率の提示による受診者満足度調査を行い、長期的には実装により疾患予防が実現した場合の医療費削減効果を調査する方向で検討している。 また、研究成果について発表可能なものについては順次国内外での学会発表を行い、論文化の準備も逐次進めていく。
|
Causes of Carryover |
新型コロナ禍のため研究協力者や適用する自治体への相談がwebツールを用いたものにとどまっていた。今後は実際に足を運びつつ独立コホートへの予測アルゴリズム適用にかかる諸々の調整を行う必要があるため交通費が必要となる。また成果物の発表にかかる学会出席、論文校正費用や出版費用も必要となってくると考えられる。
|