2022 Fiscal Year Annual Research Report
特定保健指導のアウトカム最適化を目指すAIを活用した大規模テキストデータ解析
Project/Area Number |
19K10620
|
Research Institution | Shiga University |
Principal Investigator |
池之上 辰義 滋賀大学, データサイエンス学系, 講師 (70761443)
|
Co-Investigator(Kenkyū-buntansha) |
山田 ゆかり 京都大学, 医学研究科, 特定講師 (00306846)
福間 真悟 京都大学, 医学研究科, 准教授 (60706703)
|
Project Period (FY) |
2019-04-01 – 2023-03-31
|
Keywords | 特定保健指導 / テキスト解析 / ディープラーニング |
Outline of Annual Research Achievements |
テキスト解析手法の急激な進歩に応じて、当初予定していた文脈による分散を用いた集団への分類からディープラーニングを用いるTransfomerを基盤とした解析に解析手法の変更を行う必要があると考えた。そこで、Transfomerに基づいたBERTモデルを用いて保健指導記録から1年後の健診での腹囲5㎝減少を予測するモデルの構築を行った。まず、モデル5062人の保健指導記録のみを用いてモデルの構築を行った。ついで、特定保健指導の対象となった健診における健診情報(性別、ALT、HbA1c、中性脂肪)を保健指導記録にテキストとして追加しモデルの構築を行った。モデル作成とは別にランダムに選択した613人の指導記録についてバリデーションセットとしてモデルの当てはめを行い、精度について検討を行った。 バリデーションセットでは、指導記録のみで作成したモデルでは62%の精度を得る一方で、健診情報を付与して作成したモデルでは52%の精度となった。 本研究では、1回の保健指導によりアウトカムとの関連性を評価した。しかし、保健指導では初回面談からその後の継続的な指導が行われており、1回の指導での指導記録のみで評価するには限界があると考えられた。今後、今回用いたBERTモデルとともにTransfomerに基づくGPTモデルにより各指導ごとでの要約を自動作成させ、それをBERTで解析するなどの手法が必要になると考えられた。また、健診情報についても同様にして各年ごとの要約を作成し、アウトカムとの関連性を評価していくことが必要である。
|