• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

ビッグデータ時代のグラフィカルモデル推測理論の新展開

Research Project

Project/Area Number 17K00061
Research Category

Grant-in-Aid for Scientific Research (C)

Allocation TypeMulti-year Fund
Section一般
Research Field Statistical science
Research InstitutionDoshisha University

Principal Investigator

原 尚幸  同志社大学, 文化情報学部, 教授 (40312988)

Project Period (FY) 2017-04-01 – 2022-03-31
Project Status Granted (Fiscal Year 2020)
Budget Amount *help
¥4,420,000 (Direct Cost: ¥3,400,000、Indirect Cost: ¥1,020,000)
Fiscal Year 2020: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
Fiscal Year 2019: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
Fiscal Year 2018: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2017: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
Keywords統計的因果推論 / グラフィカルモデル / 機械学習 / 金融テキストマイニング / MCMC法 / 適合度検定 / 因果推論 / マルコフ基底 / 正確確率検定 / 計算代数統計学 / グラフ / ベイジアンネットワーク / 空間疫学 / 多重比較 / 統計数学 / 多変量推測統計学
Outline of Annual Research Achievements

(1)Uplift Modelingの処置前後データへの一般化
医学やマーケティングの分野では、ある属性をもつ個人に処置を行った場合の処置効果を精度よく予測することが求められることがある。Uplift Modelingとは、統計的因果推論と機械学習を融合し、処置効果を事前に予測するための手法である。従来のUplift Modelingでは、クロスセクションデータに基づいて処置効果の予測を行うものであった。本研究では、これを、処置前・処置後の2時点のパネルデータ(以下、処置前後データ)が得られている場合へと一般化することを試みた。処置前後データの場合、処置効果を識別するための条件が緩くなることから、より実用的なシチュエーションである。Uplift Modelingは、(i) 未観測の潜在的結果変数の予測、(ii) 共変量と潜在的結果変数の組みから処置効果を学習し予測、という2段階の手続きからなるが、本研究では、(i)の予測問題に関し、従来法の処置前後データの場合への一般化に加え、さらにそれを改良する予測法の提案を行った。さらに数値実験やマーケティングデータへの応用を通して提案手法の有用性を確認した。
(2)金融テキストマイニングと深層学習を用いたビットコイン価格の予測
金融テキストマイニング分野では、SNSの投稿の感情スコアを用いた金融商品価格を予測する研究が注目されている。しかし、先行研究では、すべての投稿の感情スコアを平等に扱っており、インフルエンサーの影響などを正確に予測に反映するモデルとはなっていなかった。本研究では、エンゲージメント率で重み付けした感情スコアを用いて、ビットコイン価格を予測するモデルの提案を行った。その結果、提案手法が騰落の予測に関しては従来法を大きく改善することが確認できた。

Current Status of Research Progress
Current Status of Research Progress

3: Progress in research has been slightly delayed.

Reason

当初の予定では、本課題は2020年度で終了する予定であった。しかしながら、2020年度はコロナウィルスの影響で、オンライン講義などの対応に多くの時間を使う必要が生じ、研究活動に予定通りのエフォートをさくことができなかった。そのため、現状の成果を再考察し、論文化などの形で発表する作業を予定通りに行うことができなかった。今回、一年の延長が認められたことで、一年後には当初の予定通りに成果報告まで終えられると考えている。
一方、昨年度、コロナの影響で身動きが取れない中で、本研究課題とも関連する新たな共同研究を立ち上げることができた。人類学・考古学者との共同研究で、遺跡からの発掘物の産地構成比を時空間ベイズモデルを用いて推定する問題や、認知科学者と共同研究で、歩容などの高次元行動時系列データを分析するための手法の開発に関するものである。これらの課題でも追加的な成果が期待できることから、一年後には当初の予定よりも多くの成果が得られる可能性もある。

Strategy for Future Research Activity

2020年度までに提案した処置前後データのUplift Modelingの提案手法は、潜在的アウトカムの予測量が不連続であるなど、まだ改良の余地があるため、その点の再考察から行い、成果発表、論文化の作業を行う。
上述の遺跡からの出土品の構成比の問題にも取り組む。この問題は時空間的な相関をモデルに組み込む必要がある点、発掘の作業がランダムサンプリングとは言えない点、十分なサンプルサイズが必ずしも得られない点などが統計学的に困難な点である。この点を解決するベイズモデルの開発を目指す。
さらに、行動ビッグデータの分析手法の開発にも着手する。行動データは、モーションキャプチャーを用いた実験に基づいて収集されることが多かったが、近年では、映像情報から、OpenPoseのようなAI技術を用いることで関節の動きに関する高次元時系列データを抽出することが可能になった。行動時系列データの分析手法は、いまだスタンダードなものはないが、例えば歩容のデータなどは、犯罪捜査への応用などで注目をされている。本研究では、ガウス過程などの機械学習的な手法や深層学習の記述を用た分析手法の開発を目指す。

Report

(4 results)
  • 2020 Research-status Report
  • 2019 Research-status Report
  • 2018 Research-status Report
  • 2017 Research-status Report

Research Products

(19 results)

All 2021 2020 2019 2018 2017

All Journal Article (2 results) (of which Peer Reviewed: 2 results,  Open Access: 1 results) Presentation (15 results) (of which Int'l Joint Research: 7 results,  Invited: 2 results) Book (2 results)

  • [Journal Article] Sequential importance sampling for logistic regression model2019

    • Author(s)
      Ruriko Yoshida, Hisayuki Hara, Patrik Saluke
    • Journal Title

      Computational Models for Biochemical Reasoning and Problem Solving

      Volume: 1 Pages: 231-253

    • DOI

      10.4018/978-1-5225-7467-5.ch001

    • Related Report
      2019 Research-status Report
    • Peer Reviewed
  • [Journal Article] Multiplicity adjustment for temporal and spatial scan statistics using Markov property2018

    • Author(s)
      Kuriki Satoshi、Takahashi Kunihiko、Hara Hisayuki
    • Journal Title

      Japanese Journal of Statistics and Data Science

      Volume: 1 Issue: 1 Pages: 191-213

    • DOI

      10.1007/s42081-018-0007-5

    • NAID

      210000167269

    • ISSN
      2520-8756, 2520-8764
    • Related Report
      2018 Research-status Report
    • Peer Reviewed / Open Access
  • [Presentation] キーワード検索数とツイートの情報を用いたビットコイン価格の騰落予測2021

    • Author(s)
      松田周也, 原尚幸
    • Organizer
      人口知能学会金融情報研究会
    • Related Report
      2020 Research-status Report
  • [Presentation] 大喜利における回答の面白さに関する定量的考察ーお題と回答の意味的類似度からの考察ー2021

    • Author(s)
      戎達也, 原尚幸
    • Organizer
      言語処理学会第27回年次大会
    • Related Report
      2020 Research-status Report
  • [Presentation] 漫才対話におけるマルチモーダル情報の動的構造分析2021

    • Author(s)
      宮城夏帆, 阪田真己子, 原尚幸
    • Organizer
      情報処理学会第83回全国大会
    • Related Report
      2020 Research-status Report
  • [Presentation] Uplift modeling for panel data using switch doubly robust method2020

    • Author(s)
      Hiroaki Naito and Hisayuki Hara
    • Organizer
      Joint Statistical Meeting 2020
    • Related Report
      2020 Research-status Report
    • Int'l Joint Research
  • [Presentation] Uplift modeling with multitreatment for observational pretest-posttest data2020

    • Author(s)
      Hiroaki Naito and Hisayuki Hara
    • Organizer
      CMStatistics 2020
    • Related Report
      2020 Research-status Report
    • Int'l Joint Research
  • [Presentation] 観察研究から得られた処置前後データのためのUplift Modeling2020

    • Author(s)
      内藤宏明, 原尚幸
    • Organizer
      2020年度統計関連学会連合大会
    • Related Report
      2020 Research-status Report
  • [Presentation] 事前に処置を受けた対象を考慮したDID推定法2019

    • Author(s)
      内藤 宏明 , 原 尚幸
    • Organizer
      統計関連学会連合大会
    • Related Report
      2019 Research-status Report
  • [Presentation] Multiplicity adjustment with Markov property in temporal and spatial epidemiology2019

    • Author(s)
      Hisayuki Hara
    • Organizer
      DSSV2019
    • Related Report
      2019 Research-status Report
    • Int'l Joint Research / Invited
  • [Presentation] Transformed Outcome Methodを用いたパネルデータのためのUplift Modeling,2019

    • Author(s)
      内藤 宏明 , 原 尚幸
    • Organizer
      計算機統計学会シンポジウム
    • Related Report
      2019 Research-status Report
  • [Presentation] 離散型ベイジアンネットワークのパラメータの識別可能性2018

    • Author(s)
      内藤宏明、原尚幸
    • Organizer
      計算機統計学会シンポジウム
    • Related Report
      2018 Research-status Report
  • [Presentation] Identifiability of discrete Bayesian network with a latent source2018

    • Author(s)
      Hiroaki Naito and Hisayuki Hara
    • Organizer
      CMStatistics 2018
    • Related Report
      2018 Research-status Report
    • Int'l Joint Research
  • [Presentation] 同志社大学におけるデータサイエンス教育2018

    • Author(s)
      原尚幸
    • Organizer
      日本統計学会春季集会
    • Related Report
      2017 Research-status Report
  • [Presentation] Identifiability of Directed Graphical Models with a Latent Source2017

    • Author(s)
      原尚幸
    • Organizer
      AMBN2017
    • Related Report
      2017 Research-status Report
    • Int'l Joint Research
  • [Presentation] Data Science Education of Faculty of Culture and Information Science in Doshisha University2017

    • Author(s)
      原尚幸
    • Organizer
      Conference on Education of Data Science
    • Related Report
      2017 Research-status Report
    • Int'l Joint Research / Invited
  • [Presentation] Identifiability of binary Bayesian networks with one latent variable2017

    • Author(s)
      原尚幸
    • Organizer
      CM Statistics 2017
    • Related Report
      2017 Research-status Report
    • Int'l Joint Research
  • [Book] 統計学実践ワークブック2020

    • Author(s)
      日本統計学会(編)(原尚幸ら5名が編集委員)
    • Total Pages
      330
    • Publisher
      学術図書出版社
    • ISBN
      9784780608526
    • Related Report
      2020 Research-status Report
  • [Book] 代数的統計モデル2019

    • Author(s)
      青木敏, 竹村彰通, 原尚幸
    • Total Pages
      300
    • Publisher
      共立出版
    • ISBN
      9784320113534
    • Related Report
      2019 Research-status Report

URL: 

Published: 2017-04-28   Modified: 2021-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi