2020 年度実施状況報告書

医療ビッグデータにおける統計モデルに基づくテキスト解析方法の開発と応用

研究課題

研究課題/領域番号	17K00047
研究機関	滋賀大学
研究代表者	和泉志津恵 (大久保志津恵) 滋賀大学, データサイエンス学部, 教授 (70344413)
研究分担者	佐藤健一滋賀大学, データサイエンス学部, 教授 (30284219) 冨田哲治県立広島大学, 地域創生学部, 教授 (60346533)
研究期間 (年度)	2017-04-01 – 2022-03-31
キーワード	生物統計 / データサイエンス / 共変量効果 / 出現頻度 / 可視化
研究実績の概要	近年、国内外において、新たな治療技術の発見や創薬などの医学・医療の技術革新、そして、医療の効率化・最適化のために、医療ビッグデータからの新しい価値観の創出が期待されている。経時テキストデータの解析のため、和泉・佐藤ら(2015)は、特徴の時間変化を考慮して要約する方法を提案した。一方、加藤ら(2015)も、Word2Vec(Mikolov et al., 2013)と深層学習を用いたビッグテキストデータの解析方法を提案した。しかし、共変量の影響と、テキストの特徴の経時変化をともに考慮したテキストマイニング法の開発には至っていない。そこで、本研究では、大規模集団において経時的に観測されたテキストデータの解析方法を提案し、医療ビッグデータへ応用することを目的とする。 2020年度（4年次）には、2017年度（初年度）、2018年度（2年次）、2019年度（3年次）に得られた結果を基にして、まず、①　共変量付き経時テキストデータの解析方法の改善を検討した。共変量が2値の場合におけるIzumiら(2017) の方法で用いた統計モデルを拡張し、位置情報を持つ個体において経時測定データが観測されている場合の統計モデルを検討した（Satoh, 2020）。次に、②　アプリケーションの開発では、統計解析ソフトRを用いたサンプルプログラムと理論についての講演などを行い、汎用性を高めた（和泉, 2020; 市川, 和泉, 2020; 滋賀大学データサイエンス学部, 2020; 和泉, 2021; 和泉ら, 2021）。③　実データ解析への応用では、医療ビッグデータや調査データなど他分野のデータへの応用を、研究協力者や研究分担者と検討した（冨田, 2020; Vasileva, 和泉, 川野, 2021; 和泉, 伊藤, 立森, 2021; 和泉, 高木, 2021; Izumi et al., 2021）。
現在までの達成度 (区分)	現在までの達成度 (区分) 3: やや遅れている理由本研究では、大規模集団において経時的に観測されたテキストデータの解析方法を提案し、医療ビッグデータへ応用することを目的とする。2020 年度（4年次）の研究実績の概要に示すように、当初の目的をおおむね達成したが、完了できるところまで至っていない。 ③　実データ解析への応用では、医療ビッグデータや防災など他分野のデータへの応用を、研究協力者や研究分担者と検討した。しかし、社会情勢の影響を受け、医療ビッグデータへの応用や研究成果の論文化が未完了である。これにより、研究はやや遅れているといえる。
今後の研究の推進方策	2021年度は、2017年度から2020年度に得られた結果を基にして、主に、③　実データへの応用を行い、研究成果を考察して、研究を総括する。具体的には、健康保険組合の医療ビッグデータの解析を継続する。加えて、得られた結果を取りまとめ、研究成果の論文化を行い、本研究を総括する。
次年度使用額が生じた理由	（理由）　社会情勢を考慮して国際学会の成果発表を見送ったため、旅費やその他（大会参加費）について残高が生じた。加えて、大学院生の研究補助を必要な期間に得ることが出来なかったことから、謝金（人件費）について残高が生じた。（使用計画）　2021年度は、これまでと同様に、引き続き円滑に研究を進める。そのために、2021年度の研究費に対して、以下のような使用計画を立てている。物品として、PC周辺機器の購入を計画している。旅費として、国内学会での成果発表や研究打ち合わせのための国内旅費を計画している。謝金として、研究補助のための大学院生への謝金や文献複写への使用を計画している。その他として、英文校正や論文掲載料としての使用を計画している。

研究成果

(12件)

すべて 2021 2020 その他

すべて雑誌論文 (3件) (うち国際共著 1件、査読あり 2件、オープンアクセス 2件) 学会発表 (6件) (うち国際学会 1件、招待講演 3件) 図書 (2件) 備考 (1件)

[雑誌論文] 被爆者のアメリカ政府への思いに関する一考察－2009年日本被団協アンケート調査の自由記述回答に注目して－2021
- 著者名/発表者名
  Vladisaya Bilyanova VASILEVA, 和泉志津恵, 川野徳幸
- 雑誌名
  
  広島平和科学
  
  巻: 42 ページ: 61~79
- オープンアクセス / 国際共著
[雑誌論文] An Application of the Growth Curve Model to a Spatial Temporal data2020
- 著者名/発表者名
  Satoh Kenichi
- 雑誌名
  
  Ouyou toukeigaku
  
  巻: 49 ページ: 71～84
- DOI
  10.5023/jappstat.49.71
- 査読あり / オープンアクセス
[雑誌論文] 中性子線の生物学的効果比に基づく固形がん死亡危険度の都市比較2020
- 著者名/発表者名
  冨田哲治
- 雑誌名
  
  広島医学
  
  巻: 73 ページ: 247～250
- 査読あり
[学会発表] Data science education practice that fosters zest for living - Disaster prevention data analysis exercise2021
- 著者名/発表者名
  Shizue IZUMI, Michinori HATAYAMA, Takahiro MATSUMIYA, Hiroki ISHII
- 学会等名
  Disaster Prevention Research Institute (DPRI), Kyoto University Annual Meeting 2021
- 国際学会
[学会発表] 経時的データ分析における時間を考慮した特徴の抽出と視覚化：テキスト解析入門2021
- 著者名/発表者名
  和泉志津恵
- 学会等名
  京都大学防災研究所第42回総合防災セミナー
- 招待講演
[学会発表] 社会と大学がつながるデータサイエンス教育 - 学びの還元 -2021
- 著者名/発表者名
  和泉志津恵, 高木裕司
- 学会等名
  第27回大学教育研究フォーラム
[学会発表] 医療ビッグデータを活用したデータサイエンス教育 - 産学協働の取組み -2021
- 著者名/発表者名
  和泉志津恵, 伊藤陽一, 立森久照
- 学会等名
  第27回大学教育研究フォーラム
[学会発表] データ分析の基礎からAIの利活用へ - EBPMのさらなる推進 -2020
- 著者名/発表者名
  和泉志津恵
- 学会等名
  大津市データ分析基礎研修
- 招待講演
[学会発表] 「大学生のためのデータサイエンス(III)」第４週：自由記述のアンケート回答の分析2020
- 著者名/発表者名
  市川治, 和泉志津恵
- 学会等名
  Japanese MOOC: gacco
- 招待講演
[図書] データサイエンス入門　第2版2021
- 著者名/発表者名
  竹村　彰通、姫野　哲人、高田　聖治、和泉　志津恵、市川　治、梅津　高朗、北廣　和雄、齋藤　邦彦、佐藤　智和、白井　剛、田中　琢真、槙田　直木、松井　秀俊
- 総ページ数
  240
- 出版者
  学術図書出版社
- ISBN
  978-4-7806-0730-7
[図書] 大学生のためのデータサイエンス（Ⅲ）問題解決編2020
- 著者名/発表者名
  滋賀大学データサイエンス学部(編集)
- 総ページ数
  128
- 出版者
  日本統計協会
[備考] 滋賀大学データサイエンス学部和泉研究室ホームページ
- URL
  https://researchmap.jp/002

2020 年度 実施状況報告書

医療ビッグデータにおける統計モデルに基づくテキスト解析方法の開発と応用

研究代表者

和泉 志津恵 (大久保志津恵) 滋賀大学, データサイエンス学部, 教授 (70344413)

現在までの達成度 (区分)

理由

研究成果

[雑誌論文] 被爆者のアメリカ政府への思いに関する一考察 －2009年日本被団協アンケート調査の自由記述回答に注目して－2021

著者名/発表者名

雑誌名

[雑誌論文] An Application of the Growth Curve Model to a Spatial Temporal data2020

著者名/発表者名

雑誌名

DOI

[雑誌論文] 中性子線の生物学的効果比に基づく固形がん死亡危険度の都市比較2020

著者名/発表者名

雑誌名

[学会発表] Data science education practice that fosters zest for living - Disaster prevention data analysis exercise2021

著者名/発表者名

学会等名

[学会発表] 経時的データ分析における時間を考慮した特徴の抽出と視覚化：テキスト解析入門2021

著者名/発表者名

学会等名

[学会発表] 社会と大学がつながるデータサイエンス教育 - 学びの還元 -2021

著者名/発表者名

学会等名

[学会発表] 医療ビッグデータを活用したデータサイエンス教育 - 産学協働の取組み -2021

著者名/発表者名

学会等名

[学会発表] データ分析の基礎からAIの利活用へ - EBPMのさらなる推進 -2020

著者名/発表者名

学会等名

[学会発表] 「大学生のためのデータサイエンス(III)」第４週：自由記述のアンケート回答の分析2020

著者名/発表者名

学会等名

[図書] データサイエンス入門 第2版2021

著者名/発表者名

総ページ数

出版者

ISBN

[図書] 大学生のためのデータサイエンス（Ⅲ）問題解決編2020

著者名/発表者名

総ページ数

出版者

[備考] 滋賀大学データサイエンス学部和泉研究室ホームページ

URL

2020 年度実施状況報告書

和泉志津恵 (大久保志津恵) 滋賀大学, データサイエンス学部, 教授 (70344413)

[雑誌論文] 被爆者のアメリカ政府への思いに関する一考察－2009年日本被団協アンケート調査の自由記述回答に注目して－2021

[図書] データサイエンス入門　第2版2021