研究課題/領域番号 |
21K19648
|
研究種目 |
挑戦的研究(萌芽)
|
配分区分 | 基金 |
審査区分 |
中区分58:社会医学、看護学およびその関連分野
|
研究機関 | 九州大学 |
研究代表者 |
鴨打 正浩 九州大学, 医学研究院, 教授 (80346783)
|
研究分担者 |
吾郷 哲朗 九州大学, 医学研究院, 准教授 (30514202)
久保田 浩行 九州大学, 生体防御医学研究所, 教授 (40376603)
中島 直樹 九州大学, 大学病院, 教授 (60325529)
松尾 龍 九州大学, 医学研究院, 教授 (60744589)
北園 孝成 九州大学, 医学研究院, 教授 (70284487)
|
研究期間 (年度) |
2021-07-09 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
6,110千円 (直接経費: 4,700千円、間接経費: 1,410千円)
2023年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
2022年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
2021年度: 2,210千円 (直接経費: 1,700千円、間接経費: 510千円)
|
キーワード | 脳卒中 / データ駆動型予測 / プロテオミクス / ラジオミクス / ゲノミクス / バイオマーカー / ゲノム / プロテーム / データ駆動型 / 精密医療 / データサイエンス |
研究開始時の研究の概要 |
脳卒中患者の予後を精度高く予測するためには基礎疾患とその重症度、治療内容などに加え、大容量データを網羅的に統合し、機械学習、深層学習手法等を用いて数理的に推定する必要がある。縦断的疾患コホート研究を基軸に、情報科学と複雑系に対する最適解を見出すための次世代数理科学を融合する。個人に最適化した精密医療を実現すべく、網羅的かつ大容量のデータによるデータ駆動型予測を行う。
|
研究実績の概要 |
2007年から2017年までに福岡県内脳卒中診療基幹病院7施設に入院した急性期脳梗塞患者10513名を対象に、網羅的に診療情報を収集し、機械学習手法を用いて予後予測モデルを作成した。アウトカムである短期予後は脳梗塞発症3か月後の機能予後不良(修正Rankinスケールスコア>2)、全死亡とした。脳梗塞患者の予後に対するリスクスコアとして従来用いられてきたASTRAL、PLAN、 iScoreと、機械学習を用いたデータ駆動型予測モデルの予測能について比較検討した。集団を80%の訓練セットと20%の試験セットに無作為に100回分割し、同一の訓練セットと試験セットに対してデータ駆動型予測モデルを作成し内部検証を行った。モデルの予測能はdiscrimination(識別能)とcalibration(較正)により検討した。機械学習アルゴリズムとして、Ridge回帰、LASSO回帰、Random Forest、Extreme Gradient Boostingを用いた。 対象集団の平均年齢は73.0±12.5歳、59.1%は男性であった。無作為に分割した同一集団において、従来のリスクスコア項目を用いた予測モデルとデータ駆動型予測モデルを比較すると、いずれもデータ駆動型予測モデルの方がAUROC、AUPRCは高かった。また、Brier scoreもデータ駆動型予測の方が高値であり較正も良好であった。データ駆動型予測モデルに用いられた予測因子の変数重要度を検討すると、決定木アンサンブルモデルでは、血液検査結果など、従来知られている臨床的予測因子とは全く異なる因子が用いられていた。網羅的にデータを収集し、データ駆動型機械学習モデルを用いると、脳梗塞患者の予後を高い精度で予測することができることが示唆された。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
脳梗塞患者の患者登録を完了した。脳梗塞発症時の血漿からプロテオミクス解析により90種類の血漿タンパクを測定した。脳梗塞患者のゲノムを用いて遺伝子多型としてRNF213 p.R4810K多型を測定した。また、画像情報のDICOMデータに対して、畳み込みニューラルネットワークであるResNet (Residual Neural Networks)を用いて、画像情報の特徴を抽出している。スパース正則化線形回帰や決定木アンサンブルモデルなど様々な機械学習アルゴリズムを用いて、データ駆動型予測を行っている。現在は長期予後の追跡調査を行っており、脳卒中患者における短期および長期予後のデータ駆動型予測モデルを開発している。
|
今後の研究の推進方策 |
今後はプロテオミクス、ラジオミクス、ゲノミクス等の種々の生体情報を用いてデータ駆動型機械学習予測モデルを作成し検証を行う予定である。脳梗塞急性期に収集した血漿を用いて測定した90種類の血漿タンパク値の中から機能予後、生命予後に関連するタンパクを同定する。また、因子分析、主成分分析、クラスター分析を行い、タンパク相互の関連性について検討を行う。さらに、保存血漿を用いて、様々なバイオマーカー測定の可能性について模索する。頭部CT画像、頭部MRI画像等に対して、畳み込みニューラルネットワークであるResNet (Residual Neural Networks)を用いて、画像情報の特徴を抽出する。脳画像上の生体情報が、脳卒中患者の予後とどのような関連があるのかを検討する。ゲノム情報については、これまで測定した遺伝子多型に加えて、さらに大規模な多型の測定を検討する。 脳梗塞患者のプロテミクス、ラジオミクス、ゲノミクスデータを利用し、スパース正則化線形回帰(LASSO、Ridge、Elastic Net)、決定木アンサンブルモデル(Random Forest、XGBoost)を用いてデータ駆動型予後予測モデルを開発する。予測精度は識別能(discrimination)、較正(calibration)により評価する。内部検証として5分割交差検証および時代的検証を行い、外部検証として異なる施設間での予測精度を検証する。従来の臨床データを用いた予測とデータ駆動型予測の間で汎化性能、予測精度について検討し、変数・集団の選択、欠測値の処理、機械学習モデルの選択など、最適なモデル開発の仕組みを構築する。また、その予測モデルの各因子を仮想値として変化させた際の予測確率の変化を観察し、集団および個人における予後の変化をシミュレーションできるシステムを構築する。
|