2020 Fiscal Year Research-status Report
未観測共通原因が存在する場合の巡回因果モデル推定法の研究と応用
Project/Area Number |
20K11708
|
Research Institution | Shiga University |
Principal Investigator |
清水 昌平 滋賀大学, データサイエンス学部, 教授 (10509871)
|
Project Period (FY) |
2020-04-01 – 2025-03-31
|
Keywords | 統計的因果推論 / 統計的因果探索 |
Outline of Annual Research Achievements |
今年度は未観測共通原因を抽出し、その間の因果構造を推定する方法をつくった。観測されたデータから潜在因子(未観測共通原因)の間の因果構造を探索することは、特に困難な問題であり、多くの科学分野の研究者が関心を持っている。一定の成果は出ているものの、既存の手法は単一ドメインの観測データからの因果構造探索にのみ焦点を当てている。しかし、多くの領域では、データが異なるドメインから発生することがよくある。本論文では、Multi-Domain Linear Non-Gaussian Acyclic Models for LAtent Factors (略:MD-LiNAモデル)を提案し、シングルドメインの観測データだけでなく、マルチドメインの観測データにも対応して、潜在因子間の因果構造を推測する。具体的には、まず、潜在因子を特定し、各ドメインの因子負荷量行列を個別に推定する。次に、潜在因子間の因果構造を推定するために、誤差変数の独立性と、複数ドメインの潜在因子と注目する潜在因子との間の依存関係の特徴に基づいて、非巡回性、スパース性、elastic netタイプの制約を適用して、最適化の目的関数を導出する。このようにして得られた最適化は、漸近的に正しい結果をもたらす。また、サンプルサイズが小さい場合や相関性の高い変数がある場合にも十分な精度をもたらし、潜在因子間の因果関係の方向性と効果の大きさを同時に推定することができる。人工データおよび実データを用いた実験結果により、本手法の有効性を検証した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本年度は未観測共通原因を同定する方法について検討した。具体的には、因子分析的な測定モデルとLiNGAMモデルを組み合わせて、潜在因子を同定しつつ、その潜在因子間の因果構造を扱うモデルをつくった。
ガウス分布に含まれている情報は平均と共分散に全て含まれているが、非ガウス分布の場合は、分布の歪み方や尖り方にも情報が含まれている。そのようなガウス分布にはない情報を用いることで(Shimizu et al., 2006; 清水, 2017; Shimizu, 2019)、未観測共通原因があり、巡回性を許すモデルの識別性を確保することを検討する。特に、未観測共通原因がある場合の推定については、線形の場合には未観測共通原因の影響がモデル上は観測ごとの切片の違いに現れること(Shimizu & Bollen, 2014)を利用してベイズ階層モデルの枠組みにおける推定に持ち込むことを考える。
多変数の場合の推定については、未観測共通原因の存在を許せるなら、2変数の分析に落とし込んでも妥当性を失わないことから、2変数あるいは少変数の因果探索を繰り返す推定アルゴリズムが構築できると予想する。方法論研究と並行して、マーケティング分野および生命科学分野のデータへの適用を行い、 方法論の方向性を改善および発展させていく。その応用領域ごとに興味の対象となる非線形性、例えば交互作用や天井効果等を取り入れて分析できるようにしたい。
|
Strategy for Future Research Activity |
今年度は、非巡回性の仮定の下で潜在因子を同定する方法について考察した。今後は、巡回性を許す場合に関する考察を進めていきたい。
|
Causes of Carryover |
新型コロナの影響により、学会や打ち合わせがオンラインになり、旅費が節約されたため。
|
Research Products
(8 results)