2021 年度実施状況報告書

ビッグデータ時代のグラフィカルモデル推測理論の新展開

研究課題

研究課題/領域番号	17K00061
研究機関	京都大学
研究代表者	原尚幸京都大学, 国際高等教育院, 教授 (40312988)
研究期間 (年度)	2017-04-01 – 2023-03-31
キーワード	Uplift modeling / 統計的因果推論 / グラフィカルモデル
研究実績の概要	Uplift modelingは、処置の効果の高いターゲットを同定する手法として、近年注目される手法である。また、統計的因果推論と機械学習の接点という意味でも、社会科学、情報科学など、さまざまな視点からの研究が進んでいる。Uplift modelingは、通常、ランダム化比較試験（RCT）から得られた実験データに対しての適用を前提とした文脈で多くの先行研究があるが、本研究では、共変量調整が必要な調査観察データに対する適用を前提とした手法の開発を目指した。処置前後データを用いた差分の差法（DID法）に基づく処置群の個人処置効果の推定は、広告接触の効果計測に応用でき、近年の広告出稿のターゲット化をする上で有用であると考えられる。本研究では、既存のSDRM法（Saito et al.(2019), Proceedings of the 2019 SIAM International Conference on Data Mining, 468-476)をDIDの設定に一般化するとともに、推定方式にいくつかの改良を加えることで、RCTのデータに対して有用性が確認される手法のDID版よりも、個人の処置効果の優れた予測性能を示すことがわかった。また、本課題における成果である潜在変数をもつベイジアンネットワークモデルにおける識別可能性の条件を用いることで、一部の処置変数に欠損が生じる場合の因果効果を識別するための条件を導出した。より具体的には、処置が欠損していても、その情報を補う操作変数的なproxy variableが満たすべきグラフィカルな条件を導出した。
現在までの達成度 (区分)	現在までの達成度 (区分) 3: やや遅れている理由コロナの影響もあり、国際学会への参加や、対面での研究打ち合わせの機会が十分にもてなかったことで、成果報告のペースが予定より遅れているが、研究の進捗自体は概ね予定通りに進行している。遠方への出張ができない分、近隣の研究者との新たな共同研究も開始しており、追加の成果も期待できると考えている。
今後の研究の推進方策	Uplift modelingでは、真の処置効果が観測不能であることから、モデル選択（クロスヴァリデーションなど）をどう行うかが問題となる。既存手法は、RCTのデータに対する有用性は示されているが、観察データへの直接的な適用の是非は十分に議論されていない。そこで、共変量調整が必要な場合のuplift modelingのモデル選択手法の開発を目指す。さらに、これまでのUplift modelingでは、処置が2値の場合のものが主であり、多値の処置の場合への一般化も十分ではない。そこで、多値の場合への拡張も目指す。さらに、新たなプロジェクトとして、選択バイアスが存在する場合の時空間モデルの推定問題にも取り組む。遺跡の出土品のデータは、年代測定や産地の推定などにコストがかかるため、標本バイアスが大きいことが知られている。しかし、従来はバイアスがないものとして、産地構成比の時空間的な比較などの分析が行われてきた。ここでは、生態学などにおける、空間的な標本バイアス調整の議論を適用することで、新たな考古学データの分析手法の開発も目指す。
次年度使用額が生じた理由	参加を予定していた国際会議が、コロナの影響で中止となったことが原因である。コロナの影響で、旅費の支出に不確定要素があるため、近隣の研究者との共同研究を新たに始めたので、その対面での研究打ち合わせや、データ作成のための人件費に利用する予定である。

研究成果
(1件)

すべて学会発表 (1件)

[学会発表] 処置割り当てが立ちの処置前後データにおけるUplift modeling2021
- 著者名/発表者名
  原尚幸
- 学会等名
  統計関連学会連合大会