2017 Fiscal Year Research-status Report
クラウドソーシングを用いた統計的因果推論基盤の構築
Project/Area Number |
15K12148
|
Research Institution | Hokkaido University |
Principal Investigator |
小山 聡 北海道大学, 情報科学研究科, 准教授 (30346100)
|
Project Period (FY) |
2015-04-01 – 2019-03-31
|
Keywords | 人工知能 |
Outline of Annual Research Achievements |
近年、行政機関や企業などの持つデータを公開するオープンデータの重要性が認識されている。さらに、単にデータを公開することに留まらず、公開されたデータの分析に多くの人が参加することで、様々な観点を考慮した意思決定が可能となる。このような、クラウド(群集)によるオープンデータの分析において問題となるのが、相関関係と因果関係の判別である。単にデータ間の相関があるからといって必ずしも因果関係が存在するとは限らず、これらを混同すると誤った意思決定を行ってしまう危険性がある。とくに、未知の交絡変数による擬似相関に注意する必要がある。たとえば、負債と大学進学率には正の相関があるが、これから直ちに大学進学率が負債の原因(あるいはその逆)であると結論付けることはできず、収入といった他の変数の影響を考慮する必要がある。交絡変数となりうるものは無数にあるため、その中から可能性の高い候補を見つけるには、多くの人々の意見を収集することができるクラウドソーシングが有効であると考えられる。我々の提案したフレームワークにおいては、二つの変数に相関が表れる理由に対する説明をクラウドソーシングを用いて収集し、収集された文章の中から潜在的ディリクレ配分法を用いて交絡変数の候補を抽出する。抽出した候補に関するデータをオープンデータの中から検索し、もとの変数の組との間で条件付独立性のテストを行って候補を絞り込んだ上で、因果推論手法を用いて因果関係の方向付けを行う。世界銀行および政府の公開データを用いて実験を行い、提案したフレームワークの有効性を検証した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
クラウドソーシングを用いたオープンデータの因果分析フレームワークを設計し、実際のオープンデータとクラウドソーシングサービスを用いた実験を行うことができたため。
|
Strategy for Future Research Activity |
本研究で開発したクラウドソーシングを用いた因果分析フレームワークの有効性をより精緻に評価するための追加実験を実施し、その成果を国際会議で発表するとともに、評価の高い英文学術雑誌に論文投稿を行う。
|
Causes of Carryover |
本研究で開発したクラウドソーシングを用いた因果分析フレームワークの有効性をより精緻に評価するための追加実験を実施し、その成果を国際会議で発表するとともに、評価の高い英文学術雑誌に論文投稿を行うために補助事業期間を延長した。クラウドソーシング作業費、英文校閲費、国際会議参加登録費、旅費等に使用する。
|