研究課題/領域番号 |
21H03170
|
研究機関 | 慶應義塾大学 |
研究代表者 |
堀 里子 慶應義塾大学, 薬学部(芝共立), 教授 (70313145)
|
研究分担者 |
荒牧 英治 奈良先端科学技術大学院大学, 先端科学技術研究科, 教授 (70401073)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
キーワード | ソーシャルメディア / 患者の悩み / 患者の実践知 / 自然言語処理 / 深層学習 |
研究実績の概要 |
本研究では,ソーシャルメディアから得られる患者テキストを患者ケアの充実に活かす基盤づくりを目指して,患者の治療・生活上の悩みに関するエピソード,及び患者の実践知を抽出する自然言語処理(Natural Language Processing,NLP)システムの開発を進めている.本年度(2022年度)は各種患者テキスト(ブログ等の記述,インタビュー等の語り)から副作用疑いや悩みテキストを抽出する深層学習モデルの構築と外挿性評価を行なった. 主な成果を以下に示す. がん患者の悩み抽出手法の構築と改良:2022年度は乳がん患者ブログ(記述)に加えて,インタビュー(語り)テキストを対象に自然言語処理モデル BERTを用いた悩み抽出器の開発を試みた.事前学習済みのBERTモデルをファインチューニングして,乳がん患者ブログから患者の悩み(診療の悩み,身体の苦痛,心の苦悩,就労・経済的負担,家族・周囲の人との関係)が含まれる記事を抽出するマルチラベル分類器を構築した.加えて,ファインチューニングの前に乳がん患者ブログまたはインタビューのテキストデータを使用してドメイン適応を行なうことで,分類器の性能が顕著に向上することを示した. 有害事象症状における生活支障度(重症度)別分類手法の構築:がん治療における有害事象マネジメントは重要である.患者は生活に来した支障をブログに記述・発信することがあり,そこには診療時には表面化しない副作用のシグナルが含まれる可能性がある.本研究では,早急な治療介入を必要とする患者に焦点をあてるために,がん患者の有害事象症状を生活の支障度(重症度)別に抽出する分類器を3種の自然言語処理モデル(BERT, ELECTRA, T5)を用いたアプローチにより構築した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
乳がん患者の悩みは多岐にわたり,多角的な支援が必要である.2022年度は,がん患者ブログ及びインタビューテキストから,5種の悩み(診療の悩み,身体の苦痛,心の苦悩,就労・経済的負担,家族・周囲の人との関係)が含まれるブログ記事を悩みの種類(複数の場合もあり)とともに抽出可能なマルチラベル分類器をBERTを用いて構築した.加えて,対象とするテキストデータ(乳がん患者ブログまたはインタビュー)を使用してドメイン適応を行うことで,マルチラベル分類器の性能の顕著な向上が認められることを示した.加えて,患者ブログからがん患者の有害事象症状を生活の支障度(重症度)別に抽出する分類器を3種の自然言語処理モデル(BERT, ELECTRA, T5)を用いたアプローチによりそれぞれ構築し,性能評価を行なった.これらの研究成果の活用に向けて,患者コミュニティメンバーとの定期的な意見交換を開始した. これらの研究成果の一部は医療薬学フォーラムや医療薬学会等で発表したほか、PLoS One誌やJMIR誌に採録された.
|
今後の研究の推進方策 |
今後の研究の推進方策として,ソーシャルメディアにおける患者テキスト(記述,語り)からの自覚症状・悩み・心の支えに関連したエピソード抽出のためのNLPタスクの設計と要素技術のピックアック,深層学習モデルの開発と既に開発したモデルの性能向上,外挿性評価を継続して進める.患者コミュニティとの定例ミーティング(意見交換)やニーズ調査を実施し,エピソード抽出モデルの活用に向けたシステム開発とその評価を行う.
|