研究課題/領域番号 |
18H03300
|
研究機関 | 国立研究開発法人産業技術総合研究所 |
研究代表者 |
神嶌 敏弘 国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (50356820)
|
研究分担者 |
鹿島 久嗣 京都大学, 情報学研究科, 教授 (80545583)
馬場 雪乃 筑波大学, システム情報系, 准教授 (40711453)
|
研究期間 (年度) |
2018-04-01 – 2021-03-31
|
キーワード | 公平性 / クラウドソーシング / 機械学習 / データマイニング |
研究実績の概要 |
本研究は,公平性配慮型データマイニングという機械学習分野の中でも新しい分野の研究である.この研究分野が生じた背景について述べておく.データマイニング技術の普及に伴い,与信・採用・入試など,個人の生活に大きな影響を及ぼす分野に適用されるようになった.それに伴い,人種や性別といった情報が決定に影響してしまう事例が散見されるようになった. 公平な決定結果を得るためには,人種や性別などのセンシティブな情報への依存性を排除するために,これらの特徴とは統計的独立性を保証する制約下で予測結果を計算しなければならない.一方で,予測の効用も重要であり,この制約下で予測精度を最大にする必要がある.しかし,この予測精度と公平性の為の制約はトレードオフの関係にあり,このトレードオフを改善することが,公平性配慮型データマイニングでは重要な目標である. 以前の研究成果により,この公平性を考慮するときに,予測モデルの予測分布自体が示す分布を用いると,よいトレードオフは達成できない.なぜなら,実際の決定は予測モデルに確定的な決定則を適用するため,実際の決定結果は予測分布とは異なってしまうためである. 2018年度は,この決定則の適用を考慮しつつ,予測精度を改良する手法に取り組んだ.通常の予測モデルとはことなり,決定則の影響で最適化すべきモデルが平滑ではない.そのため計算が困難な離散最適化問題となる.この離散最適化問題を,軸ごとに最適化する手法を考案し,既存アルゴリズムよりよい精度-公平性のトレードオフを達成することに成功した.しかし,二つの国際会議に投稿したが,残念ながら採録には至らなかった. その他,公平性に配慮した機械学習技術の進展のため,国内解説,国際ワークショップの運営や講演などを行った.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
2018年度はアルゴリズムの改良に取り組み,既存手法より優れた予測精度-公平性のトレードを達成することに成功した.しかしながら,トレードオフの改善幅や,計算量の問題などいくつかの指摘があり,国際会議への採録には至らなかった.これらの査読者のコメントに対応すべく,さらなる改良が必要になる.
|
今後の研究の推進方策 |
2019年度は以下の研究を実施する. (1) 公平性アルゴリズム担当は,(1a) 2018年度より開発中の決定則を明示的に考慮したアルゴリズムの改良に取り組み,国際会議への採録をめざす. (1b) ECMLPKDD2017の Perez-Suay らの既存アルゴリズムや,線形変換を用いた公平性配慮方のデータ変換アルゴリズムの開発・実装に取り込む (2) クラウドソーシング担当は (2a) 公平性配慮型アルゴリズムを実験するための,データ収集に取り組む.具体的課題としては,質問項目の画面上の配置による違いを検証するためのデータを,クラウドソーシングを利用して収集する.
|