2015 Fiscal Year Research-status Report
クラウドソーシングを用いた統計的因果推論基盤の構築
Project/Area Number |
15K12148
|
Research Institution | Hokkaido University |
Principal Investigator |
小山 聡 北海道大学, 情報科学研究科, 准教授 (30346100)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | 人工知能 |
Outline of Annual Research Achievements |
現在さまざまなデータがインターネット上で公開されるようになってきており、それらのデータを分析してサービスや製品の向上に結びつけることが求められている。そのためには、データから表面的な相関関係だけでなく、背後に存在する因果関係を推定することが重要になってくる。しかし、行政などから公開されている多くのデータは統制実験が困難であり、この場合の因果推論は統計学や計算機科学にとってチャレンジングな問題である。一般に因果関係はデータだけからは特定できず、データの背後に何らかの仮定を導入することが必要であることが知られており、そこに人間の知識が必要であることが自動化・大規模化の大きなボトルネックとなっていた。本研究はクラウドソーシングにより多くの人の知識を導入し、計算機による自動的な処理と組み合わせることで、大規模なデータでの因果分析を可能にすることを目指している。まず、因果推論で基本となる、2変数間の因果関係の方向を推定するタスクのベンチマークであるCause-Effect Pairsデータセットを用いて、人間と計算機の推定精度を評価する実験を行った。クラウドソーシングサービス上で複数のワーカに因果関係の方向を推定させた実験では、人間は自然言語で表されたデータの変数名をもとに因果関係を判断する方が、グラフとして表現されたデータの分布を見て判断するよりも推定精度が高かった。これはクラウドソーシングで得られた背景知識を、因果関係推定において計算機による推定と補完的に用いる可能性を示している。さらに、従来はCause-Effect Pairsの一部のデータでしか比較が行われていなかった複数の因果関係推定手法を、データのタイプが異なる多数のデータを用いて推定精度や計算時間の観点から比較評価した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
初年度の主な目標であった、クラウドソーシングによる基本的なデータ収集と因果関係推定手法の検証を行うことができ、次の段階に研究を進めることができるため。
|
Strategy for Future Research Activity |
従来からベンチマークとして公開されている2変数のデータだけではなく、交絡変数も含んだ3変数以上のデータをクラウドソーシングを用いて収集し、因果関係推定アルゴリズムの検証と改良に用いる予定である。
|
Causes of Carryover |
3月に実施した国際会議発表に関する外国旅費が次年度4月の支払いとなるため。
|
Expenditure Plan for Carryover Budget |
外国旅費として使用する。
|