研究実績の概要 |
近年、国内外において、新たな治療技術の発見や創薬などの医学・医療の技術革新、そして、医療の効率化・最適化のために、医療ビッグデータからの新しい価値観の創出が期待されている。経時テキストデータの解析のため、和泉・佐藤ら(2015)は、特徴の時間変化を考慮して要約する方法を提案した。一方、加藤ら(2015)も、Word2Vec(Mikolov et al., 2013)と深層学習を用いたビッグテキストデータの解析方法を提案した。しかし、共変量の影響と、テキストの特徴の経時変化をともに考慮したテキストマイニング法の開発には至っていない。そこで、本研究では、大規模集団において経時的に観測されたテキストデータの解析方法を提案し、医療ビッグデータへ応用することを目的とする。 2020年度(4年次)には、2017年度(初年度)、2018年度(2年次)、2019年度(3年次)に得られた結果を基にして、まず、① 共変量付き経時テキストデータの解析方法の改善を検討した。共変量が2値の場合におけるIzumiら(2017) の方法で用いた統計モデルを拡張し、位置情報を持つ個体において経時測定データが観測されている場合の統計モデルを検討した(Satoh, 2020)。次に、② アプリケーションの開発では、統計解析ソフトRを用いたサンプルプログラムと理論についての講演などを行い、汎用性を高めた(和泉, 2020; 市川, 和泉, 2020; 滋賀大学データサイエンス学部, 2020; 和泉, 2021; 和泉ら, 2021)。③ 実データ解析への応用では、医療ビッグデータや調査データなど他分野のデータへの応用を、研究協力者や研究分担者と検討した(冨田, 2020; Vasileva, 和泉, 川野, 2021; 和泉, 伊藤, 立森, 2021; 和泉, 高木, 2021; Izumi et al., 2021)。
|