• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

計算代数・組合せ論を用いた高次元統計的因果推測理論の新展開

研究課題

研究課題/領域番号 21K11797
研究種目

基盤研究(C)

配分区分基金
応募区分一般
審査区分 小区分60030:統計科学関連
研究機関京都大学

研究代表者

原 尚幸  京都大学, 国際高等教育院, 教授 (40312988)

研究期間 (年度) 2021-04-01 – 2025-03-31
研究課題ステータス 交付 (2023年度)
配分額 *注記
3,900千円 (直接経費: 3,000千円、間接経費: 900千円)
2024年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2023年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2022年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2021年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
キーワードグラフィカルモデル / 因果探索 / 時系列 / 因果推論 / 統計的因果推論 / DID / VARモデル / FAVARモデル / 動的因子モデル / 計算代数統計学 / 機械学習 / 統計的因果探索
研究開始時の研究の概要

本研究では, 社会現象のような複雑な現象のメカニズムを解明するために, 現象に関わる多くの変数間にどのような因果, 相関関係が存在するのか, 因果・相関の程度はどのくらいかを観測されるデータから正しく求めるための手法の提案を目指す。より具体的には, 複雑現象における変数間の因果・相関関係を表すネットワークの推定(統計的因果探索), 因果や相関を正しく推定できるかどうかの判定(識別可能性判定), 推定できない場合に, 追加的にどのような変数を観測することによって推定可能になるか(介入の最適化)などの問題を, 古典的な数理統計学の枠組みを超え, 代数幾何学, 組合せ論などを用いて考察する。

研究実績の概要

既存の因果グラフの学習アルゴリズムは、高次元小標本の設定において精度が著しく低下することが知られている。しかし、大規模な因果グラフにおいても、構造がスパースであることはよくある。スパースな因果グラフの場合、変数間の条件付独立の関係などから、因果グラフ上のD分離に対応して、変数集合を多数の部分集合に分割することが可能である。各部分集合ごとに因果グラフを学習する分割統治型のアルゴリズムを考えることで、高次元小標本の設定において精度が向上すると考えた。因果構造が線形であると仮定すると、変数間の条件付独立関係から、変数間の祖先関係を導出することが可能である。本研究では、変数集合を各変数とその祖先集合の和集合からなる族の極大集合族にグループ化することを提案し、各極大集合にDireceLiNGAMのような因果探索アルゴリズムを適用することで、因果グラフが識別可能になることを示すとともに、計算機実験によって高次元小標本の設定で既存手法に比べて精度が改善することを示した。
高次元の時系列の分析には、潜在因子を用いたモデリングが広く用いられている。本課題では、SVARモデルの一般形であるHyvarinen et al. (2010)のVAR-LiNGAMを、潜在変数を含むモデルに拡張したFAVAR-LiNGAMを提案し、因果構造の識別アルゴリズムを与えた。昨年度の時点で、潜在因子のモデルが特殊な場合のアルゴリズムを提案していたが、今年度は、アリゴリズムが適用できるモデルの範囲を一般化した。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

因果探索に関する課題については、分割統治型アルゴリズムや潜在因子を含む時系列モデルへの適用などは、想定通りの結果が得られている。
さらに、分割統治型アルゴリズムを検討する中で、LiNGAMにおける非正規性・線形性といったモデルへの仮定を緩めることができる特殊例を見つけ、現在一般論へと整理しているところである。また、分割統治法型における変数のグループ化についても、新たな手法を着想している。また、こうした議論は、潜在的交絡因子が存在するような場合にも適用が可能な例もみつけており、年度内の一般化も可能と考えている。
加えて、Vine Copulaを一般化し、より一般の変数間の条件付独立構造を記述することが可能なCopula表現についても一定の成果は得られている。年度前半に論文化をする予定である。
これらの成果が出そろえば、当初想定していた成果かそれ以上の成果が得られることになることから、本計画は概ね順調に進展していると考える。

今後の研究の推進方策

2024年度が本課題の最終年になるが、今年度はこれまでの成果の整理、論文化と成果報告を中心に行う予定である。前述のとおり1) 変数間の祖先関係とPCアルゴリズムを用いてLiNGAMにおける変数の非正規性の仮定を緩めたアルゴリズムの提案 2) 1)のアルゴリズムの潜在的交絡因子が存在する場合への拡張(FCIアルゴリズムの一般化) 3) LiNGAMの線形性の仮定の見直し 4) Vine Copula、偏相関Vineの拡張と、高次元グラフィカルモデルのスパース推定への応用などのテーマについての成果の整理と報告を行う。

報告書

(3件)
  • 2023 実施状況報告書
  • 2022 実施状況報告書
  • 2021 実施状況報告書
  • 研究成果

    (7件)

すべて 2023 2022 2021

すべて 学会発表 (6件) (うち国際学会 1件) 図書 (1件)

  • [学会発表] FAVAR model with instantaneous effects and its identifiability2023

    • 著者名/発表者名
      Hisayuki Hara
    • 学会等名
      IMS-APRM
    • 関連する報告書
      2023 実施状況報告書
    • 国際学会
  • [学会発表] Ancestral relationship-based variable grouping method for causal discovery2023

    • 著者名/発表者名
      蔡銘, 原尚幸
    • 学会等名
      統計関連学会連合大会
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] 未観測の処置変数を含む場合のATTの識別2022

    • 著者名/発表者名
      原 尚幸
    • 学会等名
      統計関連学会連合大会
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] 処置の割り当てが多値の処置前後データに対するUplift modeling2021

    • 著者名/発表者名
      原尚幸
    • 学会等名
      統計関連学会連合大会
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] 2時点で処置がある場合のDIDによる処置効果の識別2021

    • 著者名/発表者名
      原尚幸
    • 学会等名
      確率・統計・行列シンポジウム
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] Causal Discovery for VAR model with Latent Variables2021

    • 著者名/発表者名
      原尚幸
    • 学会等名
      統計的推測理論への幾何学的アプローチ
    • 関連する報告書
      2021 実施状況報告書
  • [図書] 応用基礎としてのデータサイエンス AI×データ活用の実践2023

    • 著者名/発表者名
      北川 源四郎、竹村 彰通、赤穂 昭太郎、今泉 允聡、内田 誠一、清 智也、高野 渉、辻 真吾、原 尚幸、久野 遼平、松原 仁、宮地 充子、森畑 明昌、宿久 洋
    • 総ページ数
      384
    • 出版者
      講談社
    • ISBN
      9784065307892
    • 関連する報告書
      2022 実施状況報告書

URL: 

公開日: 2021-04-28   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi