脳卒中発症例をレセプトから抽出する機械学習予測モデルの開発と検証
Project/Area Number |
22K17375
|
Research Category |
Grant-in-Aid for Early-Career Scientists
|
Allocation Type | Multi-year Fund |
Review Section |
Basic Section 58030:Hygiene and public health-related: excluding laboratory approach
|
Research Institution | Fukushima Medical University |
Principal Investigator |
中野 裕紀 福島県立医科大学, 医学部, 准教授 (10736721)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥4,680,000 (Direct Cost: ¥3,600,000、Indirect Cost: ¥1,080,000)
Fiscal Year 2024: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2023: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
Fiscal Year 2022: ¥2,210,000 (Direct Cost: ¥1,700,000、Indirect Cost: ¥510,000)
|
Keywords | レセプト / 疾病登録 / 機械学習 / 自然言語処理 / 発症登録 / 循環器疾患 / データベース / 脳卒中 |
Outline of Research at the Start |
福島県脳卒中発症登録事業において震災2年後である2013年の発症登録を行った結果、地域差が明らかではないことを確認し、引き続き2018年の発症登録を継続しているが、1年分の発症例を採録するのに2年かかることが、課題となっている。NDBのレセプトデータを用いて福島県の脳卒中発症例抽出を実現することである。具体的には、2013年採録データを元に、レセプト情報から脳卒中発症例を抽出するアルゴリズム(機械学習予測モデル)を構築し、2018年病院採録例と予測モデル採録例 とを比較し、その精度を検証することで、これまでの病院採録よりも迅速かつ正確な脳卒中発症数を正確に把握できる可能性を示すことができる。
|
Outline of Annual Research Achievements |
2013年の脳卒中発症例を教師データとすることで、2013年レセプト情報から脳卒中例を抽出する精度の高いアルゴリズム(機械学習予測モデル)の構築に向けて、引き続き検討を行っている。前年度に引き続き、教師症例となる2018年の発症登録については、新型コロナの影響が完全には払しょくされておらず、中通りの2医療機関において採録を完了するに至っていない。
2013年遡り調査による登録件数は5350件、2018年の登録件数は5716件と6.4%増加した(2医療機関は件数に含めない)。病型については2013年は医師による登録判定済データ、2018年は医療機関の退院時診断結果を用いた暫定値である。2013年と2018年の比較では、会津と中通りにおいては、脳卒中、脳梗塞、脳内出血、くも膜下出血のいずれでも2018年の年齢調整発症率が低下していた。一方で、浜通りにおいては、いずれでも2018年が上昇していた。2013年と2018年で会津を1とした場合。2013年とは異なり、2018年は会津を1とした比較では、浜通りにおいては、脳卒中全体では1.12、脳内出血では1.27、クモ膜下出血1.64と、それぞれ有意に脳卒中、脳内出血、くも膜下出血の発症率が高かった。
引き続き、2018年についても医師による登録判定を完了させ、2医療機関の採録データを補完した上での集計と解析をすすめたい。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
環境整備やデータ取得及び整備に予想より時間がかかり、アルゴリズムの構築までには至っていない。教師症例となる2018年発症登録についても、新型コロナの影響が払しょくされておらず、2医療機関での調整に時間を要している。そのため一部の症例について採録、データクリーニング、医師による判定が完了していない。
|
Strategy for Future Research Activity |
引き続きアルゴリズム構築の作業を進めていく。未取得の2医療機関のデータについては、医療機関との調整を進めながら、取得を完了したい。
|
Report
(2 results)
Research Products
(1 results)