ソーシャルメディアからの患者の悩み・実践知の抽出技術と活用基盤の確立
Project/Area Number |
21H03170
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Allocation Type | Single-year Grants |
Section | 一般 |
Review Section |
Basic Section 58010:Medical management and medical sociology-related
|
Research Institution | Keio University |
Principal Investigator |
堀 里子 慶應義塾大学, 薬学部(芝共立), 教授 (70313145)
|
Co-Investigator(Kenkyū-buntansha) |
荒牧 英治 奈良先端科学技術大学院大学, 先端科学技術研究科, 教授 (70401073)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥16,640,000 (Direct Cost: ¥12,800,000、Indirect Cost: ¥3,840,000)
Fiscal Year 2023: ¥6,110,000 (Direct Cost: ¥4,700,000、Indirect Cost: ¥1,410,000)
Fiscal Year 2022: ¥5,720,000 (Direct Cost: ¥4,400,000、Indirect Cost: ¥1,320,000)
Fiscal Year 2021: ¥4,810,000 (Direct Cost: ¥3,700,000、Indirect Cost: ¥1,110,000)
|
Keywords | 患者の悩み / 患者の実践知 / ソーシャルメディア / 自然言語処理 / 機械学習 / 深層学習 |
Outline of Research at the Start |
本研究では、ソーシャルメディアから得られる非医療者(患者)テキストから、患者の治療・生活上の悩みに関するエピソード、及び患者の実践知を抽出することを目指して、機械学習モデルに基づく自然言語処理(Natural Language Processing, NLP)システムを開発する。さらに、開発したNLPシステムを活用して抽出したエピソードに適切な医療情報を付加したコンテンツを作成・提供したり、類似のエピソードや実践知を患者間で共有する仕組みを構築することで、患者や医療者の学び、患者ケアの充実に活かす基盤づくりを目指す。
|
Outline of Annual Research Achievements |
本研究では,ソーシャルメディアから得られる患者テキストを患者ケアの充実に活かす基盤づくりを目指して,患者の治療・生活上の悩みに関するエピソード,及び患者の実践知を抽出する自然言語処理(Natural Language Processing,NLP)システムの開発を進めている.本年度(2022年度)は各種患者テキスト(ブログ等の記述,インタビュー等の語り)から副作用疑いや悩みテキストを抽出する深層学習モデルの構築と外挿性評価を行なった. 主な成果を以下に示す. がん患者の悩み抽出手法の構築と改良:2022年度は乳がん患者ブログ(記述)に加えて,インタビュー(語り)テキストを対象に自然言語処理モデル BERTを用いた悩み抽出器の開発を試みた.事前学習済みのBERTモデルをファインチューニングして,乳がん患者ブログから患者の悩み(診療の悩み,身体の苦痛,心の苦悩,就労・経済的負担,家族・周囲の人との関係)が含まれる記事を抽出するマルチラベル分類器を構築した.加えて,ファインチューニングの前に乳がん患者ブログまたはインタビューのテキストデータを使用してドメイン適応を行なうことで,分類器の性能が顕著に向上することを示した. 有害事象症状における生活支障度(重症度)別分類手法の構築:がん治療における有害事象マネジメントは重要である.患者は生活に来した支障をブログに記述・発信することがあり,そこには診療時には表面化しない副作用のシグナルが含まれる可能性がある.本研究では,早急な治療介入を必要とする患者に焦点をあてるために,がん患者の有害事象症状を生活の支障度(重症度)別に抽出する分類器を3種の自然言語処理モデル(BERT, ELECTRA, T5)を用いたアプローチにより構築した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
乳がん患者の悩みは多岐にわたり,多角的な支援が必要である.2022年度は,がん患者ブログ及びインタビューテキストから,5種の悩み(診療の悩み,身体の苦痛,心の苦悩,就労・経済的負担,家族・周囲の人との関係)が含まれるブログ記事を悩みの種類(複数の場合もあり)とともに抽出可能なマルチラベル分類器をBERTを用いて構築した.加えて,対象とするテキストデータ(乳がん患者ブログまたはインタビュー)を使用してドメイン適応を行うことで,マルチラベル分類器の性能の顕著な向上が認められることを示した.加えて,患者ブログからがん患者の有害事象症状を生活の支障度(重症度)別に抽出する分類器を3種の自然言語処理モデル(BERT, ELECTRA, T5)を用いたアプローチによりそれぞれ構築し,性能評価を行なった.これらの研究成果の活用に向けて,患者コミュニティメンバーとの定期的な意見交換を開始した. これらの研究成果の一部は医療薬学フォーラムや医療薬学会等で発表したほか、PLoS One誌やJMIR誌に採録された.
|
Strategy for Future Research Activity |
今後の研究の推進方策として,ソーシャルメディアにおける患者テキスト(記述,語り)からの自覚症状・悩み・心の支えに関連したエピソード抽出のためのNLPタスクの設計と要素技術のピックアック,深層学習モデルの開発と既に開発したモデルの性能向上,外挿性評価を継続して進める.患者コミュニティとの定例ミーティング(意見交換)やニーズ調査を実施し,エピソード抽出モデルの活用に向けたシステム開発とその評価を行う.
|
Report
(2 results)
Research Products
(12 results)