計算代数・組合せ論を用いた高次元統計的因果推測理論の新展開

Research Project

Project/Area Number	21K11797
Research Category	Grant-in-Aid for Scientific Research (C)
Allocation Type	Multi-year Fund
Section	一般
Review Section	Basic Section 60030:Statistical science-related
Research Institution	Kyoto University
Principal Investigator	原尚幸京都大学, 国際高等教育院, 教授 (40312988)
Project Period (FY)	2021-04-01 – 2025-03-31
Project Status	Granted (Fiscal Year 2023)
Budget Amount *help	¥3,900,000 (Direct Cost: ¥3,000,000、Indirect Cost: ¥900,000) Fiscal Year 2024: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000) Fiscal Year 2023: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000) Fiscal Year 2022: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000) Fiscal Year 2021: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Keywords	グラフィカルモデル / 因果探索 / 時系列 / 因果推論 / 統計的因果推論 / DID / VARモデル / FAVARモデル / 動的因子モデル / 計算代数統計学 / 機械学習 / 統計的因果探索
Outline of Research at the Start	本研究では, 社会現象のような複雑な現象のメカニズムを解明するために, 現象に関わる多くの変数間にどのような因果, 相関関係が存在するのか, 因果・相関の程度はどのくらいかを観測されるデータから正しく求めるための手法の提案を目指す。より具体的には, 複雑現象における変数間の因果・相関関係を表すネットワークの推定（統計的因果探索）, 因果や相関を正しく推定できるかどうかの判定（識別可能性判定）, 推定できない場合に, 追加的にどのような変数を観測することによって推定可能になるか（介入の最適化）などの問題を, 古典的な数理統計学の枠組みを超え, 代数幾何学, 組合せ論などを用いて考察する。
Outline of Annual Research Achievements	既存の因果グラフの学習アルゴリズムは、高次元小標本の設定において精度が著しく低下することが知られている。しかし、大規模な因果グラフにおいても、構造がスパースであることはよくある。スパースな因果グラフの場合、変数間の条件付独立の関係などから、因果グラフ上のD分離に対応して、変数集合を多数の部分集合に分割することが可能である。各部分集合ごとに因果グラフを学習する分割統治型のアルゴリズムを考えることで、高次元小標本の設定において精度が向上すると考えた。因果構造が線形であると仮定すると、変数間の条件付独立関係から、変数間の祖先関係を導出することが可能である。本研究では、変数集合を各変数とその祖先集合の和集合からなる族の極大集合族にグループ化することを提案し、各極大集合にDireceLiNGAMのような因果探索アルゴリズムを適用することで、因果グラフが識別可能になることを示すとともに、計算機実験によって高次元小標本の設定で既存手法に比べて精度が改善することを示した。高次元の時系列の分析には、潜在因子を用いたモデリングが広く用いられている。本課題では、SVARモデルの一般形であるHyvarinen et al. (2010）のVAR-LiNGAMを、潜在変数を含むモデルに拡張したFAVAR-LiNGAMを提案し、因果構造の識別アルゴリズムを与えた。昨年度の時点で、潜在因子のモデルが特殊な場合のアルゴリズムを提案していたが、今年度は、アリゴリズムが適用できるモデルの範囲を一般化した。
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason 因果探索に関する課題については、分割統治型アルゴリズムや潜在因子を含む時系列モデルへの適用などは、想定通りの結果が得られている。さらに、分割統治型アルゴリズムを検討する中で、LiNGAMにおける非正規性・線形性といったモデルへの仮定を緩めることができる特殊例を見つけ、現在一般論へと整理しているところである。また、分割統治法型における変数のグループ化についても、新たな手法を着想している。また、こうした議論は、潜在的交絡因子が存在するような場合にも適用が可能な例もみつけており、年度内の一般化も可能と考えている。加えて、Vine Copulaを一般化し、より一般の変数間の条件付独立構造を記述することが可能なCopula表現についても一定の成果は得られている。年度前半に論文化をする予定である。これらの成果が出そろえば、当初想定していた成果かそれ以上の成果が得られることになることから、本計画は概ね順調に進展していると考える。
Strategy for Future Research Activity	2024年度が本課題の最終年になるが、今年度はこれまでの成果の整理、論文化と成果報告を中心に行う予定である。前述のとおり1) 変数間の祖先関係とPCアルゴリズムを用いてLiNGAMにおける変数の非正規性の仮定を緩めたアルゴリズムの提案 2) 1)のアルゴリズムの潜在的交絡因子が存在する場合への拡張（FCIアルゴリズムの一般化） 3) LiNGAMの線形性の仮定の見直し 4) Vine Copula、偏相関Vineの拡張と、高次元グラフィカルモデルのスパース推定への応用などのテーマについての成果の整理と報告を行う。

Report

(3 results)

Research Products
(7 results)

All 2023 2022 2021

All Presentation (6 results) (of which Int'l Joint Research: 1 results) Book (1 results)

[Presentation] FAVAR model with instantaneous effects and its identifiability2023
- Author(s)
  Hisayuki Hara
- Organizer
  IMS-APRM
- Related Report
  2023 Research-status Report
- Int'l Joint Research
[Presentation] Ancestral relationship-based variable grouping method for causal discovery2023
- Author(s)
  蔡銘, 原尚幸
- Organizer
  統計関連学会連合大会
- Related Report
  2023 Research-status Report
[Presentation] 未観測の処置変数を含む場合のATTの識別2022
- Author(s)
  原　尚幸
- Organizer
  統計関連学会連合大会
- Related Report
  2022 Research-status Report
[Presentation] 処置の割り当てが多値の処置前後データに対するUplift modeling2021
- Author(s)
  原尚幸
- Organizer
  統計関連学会連合大会
- Related Report
  2021 Research-status Report
[Presentation] 2時点で処置がある場合のDIDによる処置効果の識別2021
- Author(s)
  原尚幸
- Organizer
  確率・統計・行列シンポジウム
- Related Report
  2021 Research-status Report
[Presentation] Causal Discovery for VAR model with Latent Variables2021
- Author(s)
  原尚幸
- Organizer
  統計的推測理論への幾何学的アプローチ
- Related Report
  2021 Research-status Report
[Book] 応用基礎としてのデータサイエンス　AI×データ活用の実践2023
- Author(s)
  北川源四郎、竹村彰通、赤穂昭太郎、今泉允聡、内田誠一、清智也、高野渉、辻真吾、原尚幸、久野遼平、松原仁、宮地充子、森畑明昌、宿久洋
- Total Pages
  384
- Publisher
  講談社
- ISBN
  9784065307892
- Related Report
  2022 Research-status Report

計算代数・組合せ論を用いた高次元統計的因果推測理論の新展開

Principal Investigator

原 尚幸 京都大学, 国際高等教育院, 教授 (40312988)

¥3,900,000 (Direct Cost: ¥3,000,000、Indirect Cost: ¥900,000)

Current Status of Research Progress

Reason

Report

Research Products

[Presentation] FAVAR model with instantaneous effects and its identifiability2023

Author(s)

Organizer

Related Report

[Presentation] Ancestral relationship-based variable grouping method for causal discovery2023

Author(s)

Organizer

Related Report

[Presentation] 未観測の処置変数を含む場合のATTの識別2022

Author(s)

Organizer

Related Report

[Presentation] 処置の割り当てが多値の処置前後データに対するUplift modeling2021

Author(s)

Organizer

Related Report

[Presentation] 2時点で処置がある場合のDIDによる処置効果の識別2021

Author(s)

Organizer

Related Report

[Presentation] Causal Discovery for VAR model with Latent Variables2021

Author(s)

Organizer

Related Report

[Book] 応用基礎としてのデータサイエンス AI×データ活用の実践2023

Author(s)

Total Pages

Publisher

ISBN

Related Report

原尚幸京都大学, 国際高等教育院, 教授 (40312988)

[Book] 応用基礎としてのデータサイエンス　AI×データ活用の実践2023