2016 Fiscal Year Research-status Report
クラウドソーシングを用いた統計的因果推論基盤の構築
Project/Area Number |
15K12148
|
Research Institution | Hokkaido University |
Principal Investigator |
小山 聡 北海道大学, 情報科学研究科, 准教授 (30346100)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | 人工知能 |
Outline of Annual Research Achievements |
近年,行政機関や企業が所有する統計データなどをインターネット上で公開するオープンデータの取り組みが進められており,これらのデータを政策やビジネスにおける意思決定に活用することが期待されている.効果的な意思決定を行うためには,単にデータの間の相関関係だけでなく,因果関係を分析することが重要である.統制実験が困難な調査観察データから因果関係を推測する際には,注目している変数以外に,交絡変数の存在を考慮する必要がある.例えば,都道府県ごとの大学進学率と海外旅行者数の間に正の相関があったとしても,海外旅行が大学進学の原因であるとは直ちにいえず,家計所得といった隠れた原因の可能性を考慮する必要がある.本研究では,このようなオープンデータの中から相関のある変数のペアを抽出し,クラウドソーシングを用いて因果関係を推測させる実験を行った.その際に,単に二つの変数の間の因果関係の有無を判定させるのではなく,その理由も自然言語で記述させた.今回は研究者が複数のワーカの類似の意見を集約し,そこから名詞を抽出することで,クラウドソーシングの結果から交絡変数の候補を抽出することが可能であることを確認した.今後はこれらのプロセスにもクラウドソーシング,もしくは計算機による自動処理を導入することを考えている.また,得られた変数の候補についてのデータをオープンデータの中から発見・取得し,交絡の可能性を検証することで,因果分析全体におけるワークフローを実現することを目指す.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
クラウドソーシングにより因果分析に必要な知識を収集することが可能であることを示すことができ,分析の効率化や自動化といった次の段階に研究を進めることができるため.
|
Strategy for Future Research Activity |
因果分析全体のワークフローを検討し,その各ステップにクラウドソーシングや機械学習といった要素技術を組み込むことで,分析の効率化を推進したい.
|
Causes of Carryover |
当初は当該年度内の国際会議に参加の予定であったが,研究の成果をより評価の高い国際会議で発表するため,投稿先を翌年度開催の国際会議に変更したため.
|
Expenditure Plan for Carryover Budget |
国際会議参加のための外国旅費として使用する.
|