2022 Fiscal Year Research-status Report
患者レジストリを二次利用した潜在的患者ニーズの自動抽出方法の検討
Project/Area Number |
20K07206
|
Research Institution | National Institutes of Biomedical Innovation, Health and Nutrition |
Principal Investigator |
種村 菜奈枝 国立研究開発法人医薬基盤・健康・栄養研究所, 国立健康・栄養研究所 食品保健機能研究部, 室長 (50790630)
|
Co-Investigator(Kenkyū-buntansha) |
佐藤 淳子 慶應義塾大学, 薬学部(芝共立), 客員教授 (10231341) [Withdrawn]
漆原 尚巳 慶應義塾大学, 薬学部(芝共立), 教授 (10511917) [Withdrawn]
佐々木 剛 千葉大学, 医学部附属病院, 講師 (90507378)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Keywords | 潜在ニーズ / 機械学習 / 可視化 / ニューラルネットワーク / Word2Vec |
Outline of Annual Research Achievements |
近年,市民参画型の必要性は社会の場でも議論されている.しかしながら,日本ではハイコンテクスト文化の影響もあり,一般市民が文脈(コンテクスト)に頼らずに率直な意見を明確な言葉として表現することには不慣れである.そのため,一般市民の声を政策や様々な製品開発等へ反映することは容易ではない.本研究では,話し言葉から発話者の潜在的ニーズを予測するための機械学習モデル構築,及びニューラルネットワークを用いて単語をベクトル変換する手法である Word2Vecモデルを用いて機械学習モデルの精度改善を検討した.予備検討では,機械学習モデルの精度比較を行い,最適なモデルを選択した.本調査では,Word2Vecモデルを用いて同義語辞書を作成し,この辞書を使用して同一の特徴量に変換し学習を行う新手法を検討した.新手法の適応の有無で機械学習モデルの精度比較を行った.予備検討でのモデル選定実験の結果,モデル精度は xgboost で F 値 0.54 と最も高く,本調査では,モデル精度は同義語辞書ありで F 値 0.61,なしで F 値 0.54 であり,Word2Vecモデルを用いた同義語辞書の適応が機械学習モデルの精度改善に寄与した.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
研究機関の異動に伴い、研究の調整に時間を要したことからやや遅延している。
|
Strategy for Future Research Activity |
令和6年度は、口語テキストに基づく発話者の潜在ニーズ自動抽出の検討として、Zスコアを用いた特徴量選択によるモデル精度向上に向けた有用性評価に関する論文執筆および論文投稿予定。
|
Causes of Carryover |
研究機関の異動に伴い、研究の調整に時間を要したことからやや遅延しているため、次年度使用額が生じた。そのため、令和6年度は、口語テキストに基づく発話者の潜在ニーズ自動抽出の検討として、Zスコアを用いた特徴量選択によるモデル精度向上に向けた有用性評価に関する論文執筆および論文投稿予定。
|
Research Products
(1 results)