• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2020 年度 実施状況報告書

ビッグデータ時代のグラフィカルモデル推測理論の新展開

研究課題

研究課題/領域番号 17K00061
研究機関同志社大学

研究代表者

原 尚幸  同志社大学, 文化情報学部, 教授 (40312988)

研究期間 (年度) 2017-04-01 – 2022-03-31
キーワード統計的因果推論 / グラフィカルモデル / 機械学習 / 金融テキストマイニング
研究実績の概要

(1)Uplift Modelingの処置前後データへの一般化
医学やマーケティングの分野では、ある属性をもつ個人に処置を行った場合の処置効果を精度よく予測することが求められることがある。Uplift Modelingとは、統計的因果推論と機械学習を融合し、処置効果を事前に予測するための手法である。従来のUplift Modelingでは、クロスセクションデータに基づいて処置効果の予測を行うものであった。本研究では、これを、処置前・処置後の2時点のパネルデータ(以下、処置前後データ)が得られている場合へと一般化することを試みた。処置前後データの場合、処置効果を識別するための条件が緩くなることから、より実用的なシチュエーションである。Uplift Modelingは、(i) 未観測の潜在的結果変数の予測、(ii) 共変量と潜在的結果変数の組みから処置効果を学習し予測、という2段階の手続きからなるが、本研究では、(i)の予測問題に関し、従来法の処置前後データの場合への一般化に加え、さらにそれを改良する予測法の提案を行った。さらに数値実験やマーケティングデータへの応用を通して提案手法の有用性を確認した。
(2)金融テキストマイニングと深層学習を用いたビットコイン価格の予測
金融テキストマイニング分野では、SNSの投稿の感情スコアを用いた金融商品価格を予測する研究が注目されている。しかし、先行研究では、すべての投稿の感情スコアを平等に扱っており、インフルエンサーの影響などを正確に予測に反映するモデルとはなっていなかった。本研究では、エンゲージメント率で重み付けした感情スコアを用いて、ビットコイン価格を予測するモデルの提案を行った。その結果、提案手法が騰落の予測に関しては従来法を大きく改善することが確認できた。

現在までの達成度 (区分)
現在までの達成度 (区分)

3: やや遅れている

理由

当初の予定では、本課題は2020年度で終了する予定であった。しかしながら、2020年度はコロナウィルスの影響で、オンライン講義などの対応に多くの時間を使う必要が生じ、研究活動に予定通りのエフォートをさくことができなかった。そのため、現状の成果を再考察し、論文化などの形で発表する作業を予定通りに行うことができなかった。今回、一年の延長が認められたことで、一年後には当初の予定通りに成果報告まで終えられると考えている。
一方、昨年度、コロナの影響で身動きが取れない中で、本研究課題とも関連する新たな共同研究を立ち上げることができた。人類学・考古学者との共同研究で、遺跡からの発掘物の産地構成比を時空間ベイズモデルを用いて推定する問題や、認知科学者と共同研究で、歩容などの高次元行動時系列データを分析するための手法の開発に関するものである。これらの課題でも追加的な成果が期待できることから、一年後には当初の予定よりも多くの成果が得られる可能性もある。

今後の研究の推進方策

2020年度までに提案した処置前後データのUplift Modelingの提案手法は、潜在的アウトカムの予測量が不連続であるなど、まだ改良の余地があるため、その点の再考察から行い、成果発表、論文化の作業を行う。
上述の遺跡からの出土品の構成比の問題にも取り組む。この問題は時空間的な相関をモデルに組み込む必要がある点、発掘の作業がランダムサンプリングとは言えない点、十分なサンプルサイズが必ずしも得られない点などが統計学的に困難な点である。この点を解決するベイズモデルの開発を目指す。
さらに、行動ビッグデータの分析手法の開発にも着手する。行動データは、モーションキャプチャーを用いた実験に基づいて収集されることが多かったが、近年では、映像情報から、OpenPoseのようなAI技術を用いることで関節の動きに関する高次元時系列データを抽出することが可能になった。行動時系列データの分析手法は、いまだスタンダードなものはないが、例えば歩容のデータなどは、犯罪捜査への応用などで注目をされている。本研究では、ガウス過程などの機械学習的な手法や深層学習の記述を用た分析手法の開発を目指す。

次年度使用額が生じた理由

2020年度は、本来であれば成果発表のために4回の海外出張、5回程度の国内出張を予定していたが、コロナウィルスの影響でそのすべてが中止になったことと、研究活動にエフォートがさけなかったために、次年度使用額が生じた。
2021年度は、ビッグデータ解析を追加で行う予定であるため、そのためのハイスペックマシン、Mathematica、MATLABなどのソフトウエアの整備などに支出をする予定である。

  • 研究成果

    (7件)

すべて 2021 2020

すべて 学会発表 (6件) (うち国際学会 2件) 図書 (1件)

  • [学会発表] キーワード検索数とツイートの情報を用いたビットコイン価格の騰落予測2021

    • 著者名/発表者名
      松田周也, 原尚幸
    • 学会等名
      人口知能学会金融情報研究会
  • [学会発表] 大喜利における回答の面白さに関する定量的考察ーお題と回答の意味的類似度からの考察ー2021

    • 著者名/発表者名
      戎達也, 原尚幸
    • 学会等名
      言語処理学会第27回年次大会
  • [学会発表] 漫才対話におけるマルチモーダル情報の動的構造分析2021

    • 著者名/発表者名
      宮城夏帆, 阪田真己子, 原尚幸
    • 学会等名
      情報処理学会第83回全国大会
  • [学会発表] Uplift modeling for panel data using switch doubly robust method2020

    • 著者名/発表者名
      Hiroaki Naito and Hisayuki Hara
    • 学会等名
      Joint Statistical Meeting 2020
    • 国際学会
  • [学会発表] Uplift modeling with multitreatment for observational pretest-posttest data2020

    • 著者名/発表者名
      Hiroaki Naito and Hisayuki Hara
    • 学会等名
      CMStatistics 2020
    • 国際学会
  • [学会発表] 観察研究から得られた処置前後データのためのUplift Modeling2020

    • 著者名/発表者名
      内藤宏明, 原尚幸
    • 学会等名
      2020年度統計関連学会連合大会
  • [図書] 統計学実践ワークブック2020

    • 著者名/発表者名
      日本統計学会(編)(原尚幸ら5名が編集委員)
    • 総ページ数
      330
    • 出版者
      学術図書出版社
    • ISBN
      978-4780608526

URL: 

公開日: 2021-12-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi