2022 Fiscal Year Annual Research Report
Development of text data analysis based on statistical modeling in medical big data
Project/Area Number |
17K00047
|
Research Institution | Shiga University |
Principal Investigator |
和泉 志津恵 (大久保志津恵) 滋賀大学, データサイエンス学系, 教授 (70344413)
|
Co-Investigator(Kenkyū-buntansha) |
佐藤 健一 滋賀大学, データサイエンス学部, 教授 (30284219)
冨田 哲治 県立広島大学, 地域創生学部, 教授 (60346533)
|
Project Period (FY) |
2017-04-01 – 2023-03-31
|
Keywords | 生物統計 / データサイエンス / 共変量効果 / 出現頻度 / 可視化 |
Outline of Annual Research Achievements |
近年、国内外において、新たな治療技術の発見や創薬などの医学・医療の技術革新、そして、医療の効率化・最適化のために、医療ビッグデータからの新しい価値観の創出が期待されている。経時テキストデータの解析のため、和泉・佐藤ら(2015)は、特徴の時間変化を考慮して要約する方法を提案した。一方、加藤ら(2015)も、Word2Vec(Mikolov et al., 2013)と深層学習を用いたビッグテキストデータの解析方法を提案した。しかし、共変量の影響と、テキストの特徴の経時変化をともに考慮したテキストマイニング法の開発には至っていない。そこで、本研究では、大規模集団において経時的に観測されたテキストデータの解析方法を提案し、医療ビッグデータへ応用することを目的とする。 2022年度には、これまでに得られた結果を基にして、まず、① 経時テキストデータの解析の提案方法(Izumi et al., 2017)において利用した非負値行列因子分解に注目し、経時変化の類似性を探索するためのソフトクラスタリングを検討した(佐藤, 2022)。次に、② 実データ解析への応用では、医療ビッグデータや調査データなど他分野のデータへの応用を、研究協力者や研究分担者と検討した(Obata & Izumi, 2022; 和泉・佐藤, 2023; Vasileva, Izumi, Kawano, 2023)。さらに、米国の研究機関と滋賀大学の間で国際共同研究契約を締結し、本研究にて開発した手法など医療統計分野の研究を開始した。
|
Remarks |
新型コロナウイルス感染症の影響に伴い、当初の研究実施計画を変更した。
|
Research Products
(9 results)