計算代数・組合せ論を用いた高次元統計的因果推測理論の新展開
Project/Area Number |
21K11797
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 60030:Statistical science-related
|
Research Institution | Kyoto University |
Principal Investigator |
原 尚幸 京都大学, 国際高等教育院, 教授 (40312988)
|
Project Period (FY) |
2021-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥3,900,000 (Direct Cost: ¥3,000,000、Indirect Cost: ¥900,000)
Fiscal Year 2024: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2023: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2022: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2021: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
|
Keywords | グラフィカルモデル / 因果推論 / 因果探索 / 統計的因果推論 / DID / VARモデル / FAVARモデル / 動的因子モデル / 計算代数統計学 / 機械学習 / 統計的因果探索 |
Outline of Research at the Start |
本研究では, 社会現象のような複雑な現象のメカニズムを解明するために, 現象に関わる多くの変数間にどのような因果, 相関関係が存在するのか, 因果・相関の程度はどのくらいかを観測されるデータから正しく求めるための手法の提案を目指す。より具体的には, 複雑現象における変数間の因果・相関関係を表すネットワークの推定(統計的因果探索), 因果や相関を正しく推定できるかどうかの判定(識別可能性判定), 推定できない場合に, 追加的にどのような変数を観測することによって推定可能になるか(介入の最適化)などの問題を, 古典的な数理統計学の枠組みを超え, 代数幾何学, 組合せ論などを用いて考察する。
|
Outline of Annual Research Achievements |
LiNGAMは、モデルに線形性・非ガウス性が仮定できる状況ではポピュラーな因果探索の方法である。しかしながら、サンプルサイズがモデルの次元より小さくなる場合には実装ができないという問題がある。また、一般に次元の高いモデルに対しては、一定の精度を出すには、相対的に多くのサンプルが必要である。近年のビッグデータ分析や機械学習の流れからすると、高次元・小標本で適用可能な因果探索手法を提案することには意義があると考える。そこで、今年度はこうした点に着目をして、条件付独立関係から、変数の祖先・子孫の関係を可能なまで導出し、その関係を、変数を複数個の部分集合に分割し、部分集合ごとにLiNGAMを適用するという因果探索手法を考案した。この手法は、サンプルサイズがモデルの次元より小さい場合でも、分割された部分集合の変数の数よりも大きければ適用可能になる。さらに、LiNGAMを適用するモデルの次元が下がるので、因果探索の精度の向上も期待できる。計算機実験により、提案手法はサンプルサイズが小さい場合、真のモデルがスパースで、変数が多くの部分集合に分割される場合に、精度の高いものであることがわかった。 しかし、現時点での因果探索手法は、一段階目で求めた祖先・子孫関係を、変数の分割にしか用いておらず、二段階目の因果探索に利用していない。これを利用することで、さらなる精度の向上や、変数の非ガウス性の仮定の一般化も目指せるものと考えている。この点を2023年度では引き続き研究していく予定である。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
本課題の初年度のコロナの影響で、当初の予定よりは遅れ気味である。具体的には、成果発表が十分にできていない状況である。しかし、2022年度に、新たな因果探索手法に関する成果を蓄積できたことから、2023年度にこれまでの成果発表も行っていく予定である。
|
Strategy for Future Research Activity |
2022年度に新たに考案した因果探索手法は、「研究実績の概要」にも述べているように、改良の余地がある。2023年度は、提案手法に、祖先・子孫関係の因果探索への利用、非ガウス性の仮定の一般化についての考察をさらに行い、精度の向上を目指す。 さらに、2021年度の成果であるFAVARモデルの因果探索は、VARの次数が1、因子も1つという条件を満たす必要があった。この手法の一般化も同時に目指す。現時点では、因子が従うVARの次数が、観測変数が従うVARの次数よりも小さくなることが、モデルが一意識別されるための十分条件であり、その場合には、因果探索のアルゴリズムが得られることが予備的な分析によってわかっている。このことを理論的に確かめ、数値実験により有用性を検証していく。 さらに、一般の未観測の潜在変数(交絡因子)が存在する場合の因果探索手法に、これまでの提案手法が一般化できないかどうかも検討していく予定である。
|
Report
(2 results)
Research Products
(5 results)