2022 Fiscal Year Research-status Report
未観測共通原因が存在する場合の巡回因果モデル推定法の研究と応用
Project/Area Number |
20K11708
|
Research Institution | Shiga University |
Principal Investigator |
清水 昌平 滋賀大学, データサイエンス学系, 教授 (10509871)
|
Project Period (FY) |
2020-04-01 – 2025-03-31
|
Keywords | 因果探索 |
Outline of Annual Research Achievements |
因果探索パッケージの開発 因果探索とは、データから因果グラフを学習する方法論であり、LiNGAMは因果関係発見のためのモデルとしてよく知られている。LiNGAMに基づく因果関係発見のためのオープンソースのPythonパッケージを開発した。本パッケージは、統計的信頼性やモデルの仮定の評価に加え、時系列、複数グループ、混合データ、未観測共通原因がある場合などの様々な設定下で、LiNGAMに関する因果探索法を実装している。コードは、MITライセンスのもと、https://github.com/cdt15/lingam で自由に利用可能である。
連続変数と離散変数が混在する場合の因果探索法 観察データ、特に連続変数と離散変数の両方からなる混合データから因果関係を発見することは、基本的でありながら困難な問題である。従来の方法では、連続変数を離散化し離散変数を仮定する因果探索法を用いるなどしていたが、データ情報が失われる可能性がある。このような方法と比較して、混合データに対する制約に基づく方法やスコアに基づく方法は、データの特性から特定の条件付き独立性検定やスコア関数を導出するものである。しかし、これらは識別可能性が保証されていないため、マルコフ同値類を返すのみである。そこで、本研究では、連続変数と離散変数の構造的因果モデルに基づき、二変量および多変量の場合における識別可能性条件を考察した。さらに、混合データに対して因果構造を発見するための2段階ハイブリッド法を提案した。人工データと実世界のデータを用いた実験により、我々の提案するLiMモデルの識別可能性と有効性を検討した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究成果を広く公開するための土台となるcode packageを公開および論文としても出版できた。離散変数と連続変数の混在という実際上必要だが、比較的あまり研究されていなかったケースについて、論文として成果をまとめることができた。
|
Strategy for Future Research Activity |
これまでの研究成果に巡回する場合の結果を統合していく。
|
Causes of Carryover |
コロナ禍により出張が減ったため
|
Research Products
(9 results)