2023 Fiscal Year Research-status Report
Project/Area Number |
21K19648
|
Research Institution | Kyushu University |
Principal Investigator |
鴨打 正浩 九州大学, 医学研究院, 教授 (80346783)
|
Co-Investigator(Kenkyū-buntansha) |
吾郷 哲朗 九州大学, 医学研究院, 准教授 (30514202)
久保田 浩行 九州大学, 生体防御医学研究所, 教授 (40376603)
中島 直樹 九州大学, 大学病院, 教授 (60325529)
松尾 龍 九州大学, 医学研究院, 教授 (60744589)
北園 孝成 九州大学, 医学研究院, 教授 (70284487)
|
Project Period (FY) |
2021-07-09 – 2025-03-31
|
Keywords | 脳卒中 / データ駆動型予測 / プロテオミクス / ラジオミクス / ゲノミクス |
Outline of Annual Research Achievements |
2007年から2017年までに福岡県内脳卒中診療基幹病院7施設に入院した急性期脳梗塞患者10513名を対象に、網羅的に診療情報を収集し、機械学習手法を用いて予後予測モデルを作成した。アウトカムである短期予後は脳梗塞発症3か月後の機能予後不良(修正Rankinスケールスコア>2)、全死亡とした。脳梗塞患者の予後に対するリスクスコアとして従来用いられてきたASTRAL、PLAN、 iScoreと、機械学習を用いたデータ駆動型予測モデルの予測能について比較検討した。集団を80%の訓練セットと20%の試験セットに無作為に100回分割し、同一の訓練セットと試験セットに対してデータ駆動型予測モデルを作成し内部検証を行った。モデルの予測能はdiscrimination(識別能)とcalibration(較正)により検討した。機械学習アルゴリズムとして、Ridge回帰、LASSO回帰、Random Forest、Extreme Gradient Boostingを用いた。 対象集団の平均年齢は73.0±12.5歳、59.1%は男性であった。無作為に分割した同一集団において、従来のリスクスコア項目を用いた予測モデルとデータ駆動型予測モデルを比較すると、いずれもデータ駆動型予測モデルの方がAUROC、AUPRCは高かった。また、Brier scoreもデータ駆動型予測の方が高値であり較正も良好であった。データ駆動型予測モデルに用いられた予測因子の変数重要度を検討すると、決定木アンサンブルモデルでは、血液検査結果など、従来知られている臨床的予測因子とは全く異なる因子が用いられていた。網羅的にデータを収集し、データ駆動型機械学習モデルを用いると、脳梗塞患者の予後を高い精度で予測することができることが示唆された。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
脳梗塞患者の患者登録を完了した。脳梗塞発症時の血漿からプロテオミクス解析により90種類の血漿タンパクを測定した。脳梗塞患者のゲノムを用いて遺伝子多型としてRNF213 p.R4810K多型を測定した。また、画像情報のDICOMデータに対して、畳み込みニューラルネットワークであるResNet (Residual Neural Networks)を用いて、画像情報の特徴を抽出している。スパース正則化線形回帰や決定木アンサンブルモデルなど様々な機械学習アルゴリズムを用いて、データ駆動型予測を行っている。現在は長期予後の追跡調査を行っており、脳卒中患者における短期および長期予後のデータ駆動型予測モデルを開発している。
|
Strategy for Future Research Activity |
今後はプロテオミクス、ラジオミクス、ゲノミクス等の種々の生体情報を用いてデータ駆動型機械学習予測モデルを作成し検証を行う予定である。脳梗塞急性期に収集した血漿を用いて測定した90種類の血漿タンパク値の中から機能予後、生命予後に関連するタンパクを同定する。また、因子分析、主成分分析、クラスター分析を行い、タンパク相互の関連性について検討を行う。さらに、保存血漿を用いて、様々なバイオマーカー測定の可能性について模索する。頭部CT画像、頭部MRI画像等に対して、畳み込みニューラルネットワークであるResNet (Residual Neural Networks)を用いて、画像情報の特徴を抽出する。脳画像上の生体情報が、脳卒中患者の予後とどのような関連があるのかを検討する。ゲノム情報については、これまで測定した遺伝子多型に加えて、さらに大規模な多型の測定を検討する。 脳梗塞患者のプロテミクス、ラジオミクス、ゲノミクスデータを利用し、スパース正則化線形回帰(LASSO、Ridge、Elastic Net)、決定木アンサンブルモデル(Random Forest、XGBoost)を用いてデータ駆動型予後予測モデルを開発する。予測精度は識別能(discrimination)、較正(calibration)により評価する。内部検証として5分割交差検証および時代的検証を行い、外部検証として異なる施設間での予測精度を検証する。従来の臨床データを用いた予測とデータ駆動型予測の間で汎化性能、予測精度について検討し、変数・集団の選択、欠測値の処理、機械学習モデルの選択など、最適なモデル開発の仕組みを構築する。また、その予測モデルの各因子を仮想値として変化させた際の予測確率の変化を観察し、集団および個人における予後の変化をシミュレーションできるシステムを構築する。
|
Causes of Carryover |
令和5年度にゲノム情報の分析を行い、その結果を基に予測モデルを作成する予定であった。しかしながら、頭部CT画像をDICOMデータとして抽出し、畳み込みニューラルネットワークであるResNet (Residual Neural Networks)を用いて特徴抽出を行ったところ、画像情報を抽出し収集する目途がたった。そこで計画を変更し、ラジオミクスデータを用いた解析に着手し、画像による生体情報を収集し、ラジオミクスデータ駆動型解析を行うこととした。次年度に画像情報の収集と解析のための経費に充てることとしたい。
|
Research Products
(2 results)