2014 Fiscal Year Annual Research Report
Project/Area Number |
24500194
|
Research Institution | National Institute of Advanced Industrial Science and Technology |
Principal Investigator |
神嶌 敏弘 独立行政法人産業技術総合研究所, ヒューマンライフテクノロジー研究部門, 主任研究員 (50356820)
|
Co-Investigator(Kenkyū-buntansha) |
赤穗 昭太郎 独立行政法人産業技術総合研究所, ヒューマンライフテクノロジー研究部門, 研究グループ長 (40356340)
|
Project Period (FY) |
2012-04-01 – 2015-03-31
|
Keywords | 公正性 / 独立性 / 中立性 / データマイニング / 機械学習 / 推薦システム / フィルタバブル |
Outline of Annual Research Achievements |
本研究の目的は,公正性・中立性に配慮したデータマイニング技術を開発することにある.データマイニング技術は,与信や採用といった重要な決定にも関与している.このとき,性別・人種・出生などの社会的公正性の観点から利用すべきでない情報の関与を排除すべきである.これには,単純にこれらの情報をモデルから除外するだけでは不十分であることが知られている.例えば,特定の人種が,特定の区域に住んでいる場合,これらの情報には高い相関が生じ,人種という情報を除外しても,居住区域の情報から間接的に差別的な判断がなされることがあり,これをred-lining効果という. このような判断を回避するために,本研究では,与信や採用などの決定事項と,性別・人種など配慮を要する情報との間の統計的独立性を保証することで,こうした公正性を確保する分析モデルを研究している. 前年度は統計的独立性を組み込むことで公正性を強化する手法について,モデルバイアスや決定則の影響により,単純なモデル上での独立性では十分に公正性を保てないことを理論的に示し,単純ベイズ法についてこの問題を解消した.本年度は,この補正手法を,SVMやロジスティック回帰など生成モデルによらない手法にも適用できるよう拡張した.さらに,公正化したあとのクラスが元の特徴量とは独立であるとの仮定を緩和する手法を開発した. 前年度は利用者に提供する情報の中立性を強化する推薦独立性を考慮した推薦アルゴリズムの高速化をおこなった.しかし,この手法は分布の平均だけを考慮するという,非常に大まかな近似を行っていた.そこで,分布の二次以上の統計量も考慮でき,かつ計算複雑度を増加させない手法を開発した.
|