• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2017 年度 実施状況報告書

医療ビッグデータにおける統計モデルに基づくテキスト解析方法の開発と応用

研究課題

研究課題/領域番号 17K00047
研究機関滋賀大学

研究代表者

和泉 志津恵 (大久保志津恵)  滋賀大学, データサイエンス学部, 教授 (70344413)

研究分担者 佐藤 健一  広島大学, 原爆放射線医科学研究所, 准教授 (30284219)
冨田 哲治  県立広島大学, 経営情報学部, 准教授 (60346533)
研究期間 (年度) 2017-04-01 – 2020-03-31
キーワード生物統計 / データサイエンス / 共変量効果 / 出現頻度 / 可視化
研究実績の概要

近年、国内外において、新たな治療技術の発見や創薬などの医学・医療の技術革新、そして、医療の効率化・最適化のために、医療ビッグデータからの新しい価値観の創出が期待されている。経時テキストデータの解析のため、和泉・佐藤ら(2015)は、特徴の時間変化を考慮して要約する方法を提案した。一方、加藤ら(2015)も、Word2Vec (Mikolov et al., 2013) と深層学習を用いたビッグテキストデータの解析方法を提案した。しかし、共変量の影響と、テキストの特徴の経時変化をともに考慮したテキストマイニング法の開発には至っていない。そこで、本研究では、大規模集団において経時的に観測されたテキストデータの解析方法を提案し、医療ビッグデータへ応用することを目的とする。
平成29年度(初年度)には、和泉・佐藤ら(2015) の経時テキストデータに対して提案された方法を共変量付き経時テキストデータへ拡張した。観測時点でのキーワードの出現確率に対して、まず、セミパラメトリックな変化係数を用いて、共変量の効果を推測した。次に、多次元尺度法を用いて、テキストの特徴の経時変化と共変量の関係を視覚化した。キーワードの頻度データに対しても、キーワードの出現確率の場合と同様に理論の拡張を行なった。また、提案方法について統計ソフトRのデータ解析プログラムを作成した。さらに、医療ビッグデータの解析用作業データの加工方法についても検討した。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

本研究では、大規模集団において経時的に観測されたテキストデータの解析方法を提案し、医療ビッグデータへ応用することを目的とする。平成29年度(初年度)の研究計画の概要は、① 共変量付き経時テキストデータへの拡張、すなわち、和泉・佐藤ら(2015) の経時テキストデータに対して提案された方法を共変量付き経時テキストデータへ拡張する、であった。
観測時点でのキーワードの出現確率に対して、まず、セミパラメトリックな変化係数を用いて、共変量の効果を推測した。次に、多次元尺度法を用いて、テキストの特徴の経時変化と共変量の関係を視覚化した(Izumi, et al., 2017a)。キーワードの頻度データに対しても、キーワードの出現確率の場合と同様に理論の拡張を行なった(Izumi, et al., 2017b)。これにより、研究はおおむね順調に進展しているといえる。

今後の研究の推進方策

平成30年度は、平成29年度までの研究:①の方法論の改善を行いながら、② ウェブアプリケーションの開発、すなわち ①で提案した方法を実用化するウェブアプリケーションを開発する。そして、③ 実データへ応用するための準備を行う。具体的には、Shinyを用いて統計ソフトRのデータ解析プログラムをウェブアプリケーション化する。そして、①で提案した方法を全国土木建築国民健康保険組合の医療ビッグデータへ応用するために、解析用作業データを準備する。研究が当初計画どおりに進まない時は、別のソフトウェアや別のデータについても検討する。

次年度使用額が生じた理由

(理由) 予定していたワークステーションの購入が、モデルチェンジのため延期となり、物品について残高が生じた。加えて、大学院生の研究補助を必要な期間に得ることが出来なかったことから、人件費・謝金について残高が生じた。
(使用計画) 平成30年度は、平成29年度と同様に、引き続き円滑に研究を進める。そのために、平成30年度の研究費に対して、以下のような使用計画を立てている。物品として、ワークステーションの購入を計画している。旅費として、国内学会での成果発表や研究打ち合わせのための国内旅費、および国際学会での成果発表のための外国旅費を計画している。謝金として、研究補助のための大学院生への謝金や文献複写への使用を計画している。その他として、ソフトウェアの更新費や学術大会への参加費としての使用を計画している。

  • 研究成果

    (16件)

すべて 2018 2017

すべて 雑誌論文 (6件) (うち国際共著 1件、 査読あり 3件、 オープンアクセス 2件) 学会発表 (10件) (うち国際学会 5件、 招待講演 1件)

  • [雑誌論文] Bioavailable serum estradiol may alter radiation risk of postmenopausal breast cancer: a nested case-control study2018

    • 著者名/発表者名
      Grant Eric J.、Cologne John B.、Sharp Gerald B.、Eguchi Hidetaka、Stevens Richard G.、Izumi Shizue、Kim Young-Min、Berrington de Gonzalez Amy、Ohishi Waka、Nakachi Kei
    • 雑誌名

      International Journal of Radiation Biology

      巻: 94 ページ: 97~105

    • DOI

      DOI:10.1080/09553002.2018.1419303

    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] エビデンスに基づくデータサイエンス教育2018

    • 著者名/発表者名
      和泉志津恵
    • 雑誌名

      統計数理研究所共同研究リポート399「統計教育実践研究」

      巻: 10 ページ: 89~94

  • [雑誌論文] データサイエンス教育のための実践的カリキュラムに関する研究2018

    • 著者名/発表者名
      櫻井尚子、和泉志津恵、深澤弘美
    • 雑誌名

      統計数理研究所共同研究リポート399「統計教育実践研究」

      巻: 10 ページ: 9~12

  • [雑誌論文] Estimating and Visualizing the Time-varying Effects of a Binary Covariate on Longitudinal Big Text Data2017

    • 著者名/発表者名
      Izumi Shizue、Tonda Tetsuji、Kawano Noriyuki、Satoh Kenichi
    • 雑誌名

      International Journal of Networked and Distributed Computing

      巻: 5 ページ: 243~243

    • DOI

      doi:10.2991/ijndc.2017.5.4.6

    • 査読あり / オープンアクセス
  • [雑誌論文] Visualize the longitudinal big text data with a binary covariate: an approach based on keyword's frequency2017

    • 著者名/発表者名
      Izumi Shizue、Tonda Tetsuji、Kawano Noriyuki、Satoh Kenichi
    • 雑誌名

      Proceedings of 2nd Intl Conf on Big Data, Cloud Computing, Data Science & Engineering

      巻: - ページ: 284~289

    • DOI

      doi:10.1109/acit-csii-bcd.2017.47

    • 査読あり
  • [雑誌論文] 英国王立統計学会Significanceから 米国における"America(アメリカ)"の単語の頻度2017

    • 著者名/発表者名
      和泉志津恵
    • 雑誌名

      統計

      巻: 68 ページ: 73~77

  • [学会発表] 共変量の付いた経時的テキストデータにおける統計モデルに基づく分類と視覚化2018

    • 著者名/発表者名
      和泉志津恵
    • 学会等名
      第154回 京都バイオスタティスティクスセミナー
  • [学会発表] リスクコミュニケーションにおけるビッグデータの利活用:公的データへのアプローチ.2018

    • 著者名/発表者名
      和泉志津恵.
    • 学会等名
      科研費研究集会「データサイエンスにおける統計モデルに基づく解析方法の開発と応用」
  • [学会発表] Use of Big Data in Risk Communication: Statistical Methods for Longitudinally Issued Text Data.2018

    • 著者名/発表者名
      Izumi S.
    • 学会等名
      2018 International Conference for Leading and Young Computer Scientists (IC-LYCS 2018)
    • 国際学会 / 招待講演
  • [学会発表] データサイエンス教育のための実践的カリキュラムに関する研究2018

    • 著者名/発表者名
      櫻井尚子、和泉志津恵、 深澤弘美
    • 学会等名
      第14回 統計教育の方法論ワークショップ(JCOTS18)
  • [学会発表] 広島・長崎平和宣言における平和観の経時変化の違いについて~単語出現頻度に基づく考察.2017

    • 著者名/発表者名
      冨田哲治、佐藤健一、和泉志津恵
    • 学会等名
      第58回原子爆弾後障害研究会
  • [学会発表] Visualize the longitudinal big text data with a binary covariate: an approach based on keyword's frequency2017

    • 著者名/発表者名
      Izumi S.、Tonda T.、Kawano N.、Satoh K.
    • 学会等名
      2nd International Conference on Big Data, Cloud Computing, and Data Science (BCD2017)
    • 国際学会
  • [学会発表] 変化係数を利用したロジスティックモデルによる生存時間解析の試み2017

    • 著者名/発表者名
      佐藤健一、冨田哲治、和泉志津恵
    • 学会等名
      2017年度統計関連学会連合大会
  • [学会発表] Cope non-compliance with assigned treatments in clinical trials, using a global goodness-of-fit test for linear structural mean models.2017

    • 著者名/発表者名
      Izumi S. and Taguri, M.
    • 学会等名
      The 21st International Epidemiological Association (IEA) World Congress of Epidemiology (WCE2017)
    • 国際学会
  • [学会発表] Real Data Oriented Project-Based Learning Model of Shiga University: Results from Pilot Classes.2017

    • 著者名/発表者名
      Izumi S.
    • 学会等名
      United States Conference of Teaching Statistics (USCOTS)'17
    • 国際学会
  • [学会発表] Development of Introductory Statistical Courses in the Japanese Massive Open Online Course: a Preliminary Report.2017

    • 著者名/発表者名
      Izumi S. and Sue, M.
    • 学会等名
      United States Conference of Teaching Statistics (USCOTS)'17
    • 国際学会

URL: 

公開日: 2018-12-17  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi