2021 Fiscal Year Annual Research Report
Causal inference with small labeled samples
Project/Area Number |
21J14882
|
Research Institution | Kyoto University |
Principal Investigator |
原田 将之介 京都大学, 情報学研究科, 特別研究員(DC2)
|
Project Period (FY) |
2021-04-28 – 2023-03-31
|
Keywords | 因果推論 / 因果効果推定 / 介入効果推定 |
Outline of Annual Research Achievements |
2021年度では, 特徴量としてグラフ構造データを補助情報として持つ介入に対する因果効果推定を行った. 因果推論では主に二値の介入に絞って因果効果を考えることが多いが, 実際には膨大な数の介入が考えられる. しかし, 介入の数が多ければ多いほど一つ一つの介入に対するデータの量は少なくなり, 適切な因果効果推定が難しくなる. このような問題を解決する方法として介入に付随する特徴量を考えることが出来る. 典型的な例として化合物グラフとして扱える薬剤介入がある. 薬剤介入に付随する化合物グラフに対してグラフ構造を保存するような手法を適用して,特徴表現を抽出することで, データの量が少ない場合でも, データの量に対して頑健な予測モデルの構築が期待される. しかし, 特徴量をそのまま適用すると観測バイアスによるデータの偏りによって正しく因果効果を推定することが出来ない. 本研究では, グラフ構造を持つ介入に対して因果効果推定を行い, グラフ構造を利用しながら観測バイアスを軽減させる手法を開発した. 提案手法はグラフ構造を持つデータに大して有効なグラフニューラルネットワークによる強力な特徴表現能力を活かしながら因果効果推定を行うことが出来る. 実データを用いた実験において, 既存手法と比較して優れた精度を示すことを確認した. また得られた成果は学術論文として, データマイニング分野において重要な国際会議の一つであるCIKM2021に採択されている.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
主な目標であったグラフ構造を持つ介入における因果効果推定において, 性能の向上を確認出来, またその結果を学術論文として取りまとめ発表した. また現在は, 隠れ交絡変数を考慮する因果効果推定に関する研究に取り組んでいる. 隠れ交絡変数とは介入の割当て及び結果に影響を与える変数で, 観測データに含まれていない変数を指し, 適切な因果効果を推定する際に推論が必要な変数である. 本研究は, 2022年度中に研究論文としてまとめ, 投稿する見込みである. 計画していた二つの研究の内, 一方を学術論文として発表し, もう一方は現在執筆中であり, 当初の計画を概ね予定通りに実行出来ている.
|
Strategy for Future Research Activity |
今後の方針として, 隠れ交絡変数を考慮する研究に引き続き取り組む予定である. また得られた結果を学術論文として取りまとめ, 発表する予定である. また2022年度中に計画していた構造データとの融合については現在取り組んでいる研究の進捗状況の影響を受けるため, 進捗具合によっては計画に遅れが生じる可能性があるが, 関連研究等については並行して調査を進め, これをまとめる予定である.
|