研究課題/領域番号 |
17K00061
|
研究機関 | 同志社大学 |
研究代表者 |
原 尚幸 同志社大学, 文化情報学部, 教授 (40312988)
|
研究期間 (年度) |
2017-04-01 – 2022-03-31
|
キーワード | 統計的因果推論 / グラフィカルモデル / 機械学習 / 金融テキストマイニング |
研究実績の概要 |
(1)Uplift Modelingの処置前後データへの一般化 医学やマーケティングの分野では、ある属性をもつ個人に処置を行った場合の処置効果を精度よく予測することが求められることがある。Uplift Modelingとは、統計的因果推論と機械学習を融合し、処置効果を事前に予測するための手法である。従来のUplift Modelingでは、クロスセクションデータに基づいて処置効果の予測を行うものであった。本研究では、これを、処置前・処置後の2時点のパネルデータ(以下、処置前後データ)が得られている場合へと一般化することを試みた。処置前後データの場合、処置効果を識別するための条件が緩くなることから、より実用的なシチュエーションである。Uplift Modelingは、(i) 未観測の潜在的結果変数の予測、(ii) 共変量と潜在的結果変数の組みから処置効果を学習し予測、という2段階の手続きからなるが、本研究では、(i)の予測問題に関し、従来法の処置前後データの場合への一般化に加え、さらにそれを改良する予測法の提案を行った。さらに数値実験やマーケティングデータへの応用を通して提案手法の有用性を確認した。 (2)金融テキストマイニングと深層学習を用いたビットコイン価格の予測 金融テキストマイニング分野では、SNSの投稿の感情スコアを用いた金融商品価格を予測する研究が注目されている。しかし、先行研究では、すべての投稿の感情スコアを平等に扱っており、インフルエンサーの影響などを正確に予測に反映するモデルとはなっていなかった。本研究では、エンゲージメント率で重み付けした感情スコアを用いて、ビットコイン価格を予測するモデルの提案を行った。その結果、提案手法が騰落の予測に関しては従来法を大きく改善することが確認できた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
当初の予定では、本課題は2020年度で終了する予定であった。しかしながら、2020年度はコロナウィルスの影響で、オンライン講義などの対応に多くの時間を使う必要が生じ、研究活動に予定通りのエフォートをさくことができなかった。そのため、現状の成果を再考察し、論文化などの形で発表する作業を予定通りに行うことができなかった。今回、一年の延長が認められたことで、一年後には当初の予定通りに成果報告まで終えられると考えている。 一方、昨年度、コロナの影響で身動きが取れない中で、本研究課題とも関連する新たな共同研究を立ち上げることができた。人類学・考古学者との共同研究で、遺跡からの発掘物の産地構成比を時空間ベイズモデルを用いて推定する問題や、認知科学者と共同研究で、歩容などの高次元行動時系列データを分析するための手法の開発に関するものである。これらの課題でも追加的な成果が期待できることから、一年後には当初の予定よりも多くの成果が得られる可能性もある。
|
今後の研究の推進方策 |
2020年度までに提案した処置前後データのUplift Modelingの提案手法は、潜在的アウトカムの予測量が不連続であるなど、まだ改良の余地があるため、その点の再考察から行い、成果発表、論文化の作業を行う。 上述の遺跡からの出土品の構成比の問題にも取り組む。この問題は時空間的な相関をモデルに組み込む必要がある点、発掘の作業がランダムサンプリングとは言えない点、十分なサンプルサイズが必ずしも得られない点などが統計学的に困難な点である。この点を解決するベイズモデルの開発を目指す。 さらに、行動ビッグデータの分析手法の開発にも着手する。行動データは、モーションキャプチャーを用いた実験に基づいて収集されることが多かったが、近年では、映像情報から、OpenPoseのようなAI技術を用いることで関節の動きに関する高次元時系列データを抽出することが可能になった。行動時系列データの分析手法は、いまだスタンダードなものはないが、例えば歩容のデータなどは、犯罪捜査への応用などで注目をされている。本研究では、ガウス過程などの機械学習的な手法や深層学習の記述を用た分析手法の開発を目指す。
|
次年度使用額が生じた理由 |
2020年度は、本来であれば成果発表のために4回の海外出張、5回程度の国内出張を予定していたが、コロナウィルスの影響でそのすべてが中止になったことと、研究活動にエフォートがさけなかったために、次年度使用額が生じた。 2021年度は、ビッグデータ解析を追加で行う予定であるため、そのためのハイスペックマシン、Mathematica、MATLABなどのソフトウエアの整備などに支出をする予定である。
|