• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2021 年度 実施状況報告書

医療ビッグデータにおける統計モデルに基づくテキスト解析方法の開発と応用

研究課題

研究課題/領域番号 17K00047
研究機関滋賀大学

研究代表者

和泉 志津恵 (大久保志津恵)  滋賀大学, データサイエンス学部, 教授 (70344413)

研究分担者 佐藤 健一  滋賀大学, データサイエンス学部, 教授 (30284219)
冨田 哲治  県立広島大学, 地域創生学部, 教授 (60346533)
研究期間 (年度) 2017-04-01 – 2023-03-31
キーワード生物統計 / データサイエンス / 共変量効果 / 出現頻度 / 可視化
研究実績の概要

近年、国内外において、新たな治療技術の発見や創薬などの医学・医療の技術革新、そして、医療の効率化・最適化のために、医療ビッグデータからの新しい価値観の創出が期待されている。経時テキストデータの解析のため、和泉・佐藤ら(2015)は、特徴の時間変化を考慮して要約する方法を提案した。一方、加藤ら(2015)も、Word2Vec(Mikolov et al., 2013)と深層学習を用いたビッグテキストデータの解析方法を提案した。しかし、共変量の影響と、テキストの特徴の経時変化をともに考慮したテキストマイニング法の開発には至っていない。そこで、本研究では、大規模集団において経時的に観測されたテキストデータの解析方法を提案し、医療ビッグデータへ応用することを目的とする。
2021年度(5年次)には、2017年度(初年度)、2018年度(2年次)、2019年度(3年次)、2020年度(4年次)に得られた結果を基にして、まず、① 共変量付き経時テキストデータの解析方法の改善を検討した。その際、一般化線形モデルの枠組みを用いるためGamma Regression Modelの理論も検討した(Tonda et al., 2021)。次に、② アプリケーションの開発では、統計解析ソフトRとShinyを用いて線形重回帰・ロジスティック回帰に関するWebアプリケーションを作成した(佐藤, 2021; https://kenichi-satoh.shinyapps.io/LinearModels/)。③ 実データ解析への応用では、医療ビッグデータや調査データなど他分野のデータへの応用を、研究協力者や研究分担者と検討した(冨田, 佐藤,2022; Okazaki et al., 2022; 松宮, 和泉, 畑山, 2022)。

現在までの達成度 (区分)
現在までの達成度 (区分)

3: やや遅れている

理由

本研究では、大規模集団において経時的に観測されたテキストデータの解析方法を提案し、医療ビッグデータへ応用することを目的とする。2021 年度(5年次)の研究実績の概要に示すように、当初の目的をおおむね達成したが、完了できるところまで至っていない。
③ 実データ解析への応用では、医療ビッグデータや防災など他分野のデータへの応用を、研究協力者や研究分担者と検討した。しかし、社会情勢の影響を受け、医療ビッグデータへの応用や研究成果の論文化が未完了である。
これにより、研究はやや遅れているといえる。

今後の研究の推進方策

2022年度は、2017年度から2021年度に得られた結果を基にして、主に、③ 実データへの応用を行い、研究成果を考察して、研究を総括する。具体的には、健康保険組合の医療ビッグデータの解析を継続する。加えて、得られた結果を取りまとめ、研究成果の論文化を行い、本研究を総括する。

次年度使用額が生じた理由

(理由) 社会情勢を考慮して国際学会の成果発表を見送ったため、旅費やその他(大会参加費)について残高が生じた。加えて、大学院生の研究補助を必要な期間に得ることが出来なかったことから、謝金(人件費)について残高が生じた。
(使用計画) 2022年度は、これまでと同様に、引き続き円滑に研究を進める。そのために、2022年度の研究費に対して、以下のような使用計画を立てている。物品として、PC周辺機器の購入を計画している。旅費として、国内学会での成果発表や研究打ち合わせのための国内旅費を計画している。謝金として、研究補助のための大学院生への謝金や文献複写への使用を計画している。その他として、英文校正や論文掲載料としての使用を計画している。

  • 研究成果

    (9件)

すべて 2022 2021 その他

すべて 雑誌論文 (3件) (うち査読あり 3件、 オープンアクセス 3件) 学会発表 (3件) (うち国際学会 2件、 招待講演 1件) 図書 (2件) 備考 (1件)

  • [雑誌論文] 公的統計の利活用における、オープンGISデータおよびフリーツールの有用性と課題―病児保育施設へのアクセシビリティ解析を例に―2022

    • 著者名/発表者名
      冨田哲治, 佐藤裕哉
    • 雑誌名

      統計研究彙報

      巻: 79 ページ: 61-74

    • 査読あり / オープンアクセス
  • [雑誌論文] Gamma Regression Model with Nuisance Baseline for Tree Growth Data2021

    • 著者名/発表者名
      Tonda Tetsuji、Kamo Ken-ichi、Takahashi Masayoshi
    • 雑誌名

      FORMATH

      巻: 20 ページ: n/a~n/a

    • DOI

      10.15684/formath.20.001

    • 査読あり / オープンアクセス
  • [雑誌論文] Contribution of radiation education to anxiety reduction among Fukushima Daiichi Nuclear Power Plant workers: a cross sectional study using a text mining method2021

    • 著者名/発表者名
      Okazaki Ryuji、Satoh Kenichi、Hasegawa Arifumi、Matsuda Naoki、Kato Takaaki、Kanda Reiko、Shimada Yoshiya、Hayashi Takuya、Kohzaki Masaoki、Mafune Kosuke、Mori Koji
    • 雑誌名

      Journal of Radiation Research

      巻: 63 ページ: 44~50

    • DOI

      10.1093/jrr/rrab101

    • 査読あり / オープンアクセス
  • [学会発表] 「大学生のための医療統計学」教育プログラムとメッシュ統計の活用 次年度の活動計画2022

    • 著者名/発表者名
      和泉志津恵,伊藤陽一,松井茂之,佐藤彰洋
    • 学会等名
      2021年度第2回統計数理研究所共同研究集会「世界メッシュコード研究会」
    • 国際学会
  • [学会発表] 高校生のためのデータ駆動型の授業デザインと実践 -地域の課題から気づきが生まれるデータサイエンス教育-2022

    • 著者名/発表者名
      松宮敬広, 和泉志津恵, 畑山満則
    • 学会等名
      第 19 回 統計教育の方法論ワークショップ・理数系教員授業力向上研修会(東京)
    • 国際学会
  • [学会発表] データ分析の基礎からAIの利活用へ - EBPMのさらなる推進 -2021

    • 著者名/発表者名
      和泉志津恵
    • 学会等名
      大津市データ分析基礎研修2021年度
    • 招待講演
  • [図書] データサイエンスの歩き方2022

    • 著者名/発表者名
      滋賀大学データサイエンス学部、長崎大学情報データ科学部
    • 総ページ数
      256
    • 出版者
      学術図書出版社
    • ISBN
      978-4780609363
  • [図書] 大学生のためのデータサイエンス (I) 改訂版 オフィシャルスタディノート2021

    • 著者名/発表者名
      滋賀大学データサイエンス学部
    • 総ページ数
      148
    • 出版者
      日本統計協会
    • ISBN
      978-4822341305
  • [備考] 滋賀大学データサイエンス学部和泉研究室ホームページ

    • URL

      https://researchmap.jp/002

URL: 

公開日: 2022-12-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi