2016 Fiscal Year Research-status Report
データマイニングにおける中立・公正性に配慮するデータ変換技術
Project/Area Number |
15K00327
|
Research Institution | National Institute of Advanced Industrial Science and Technology |
Principal Investigator |
神嶌 敏弘 国立研究開発法人産業技術総合研究所, 人間情報研究部門, 主任研究員 (50356820)
|
Co-Investigator(Kenkyū-buntansha) |
赤穗 昭太郎 国立研究開発法人産業技術総合研究所, 人間情報研究部門, 研究グループ長 (40356340)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | fairness / data mining / machine learning |
Outline of Annual Research Achievements |
本年度は従来からの,公平性制約と確率的行列分解を用いた独立性強化型推薦システムに加えて,新たな公平性制約の実現手法について研究を進めた.一つは確率的潜在意味分析モデルの拡張であり,もう一つは後処理による簡潔な手法である. まず,従来からの公平性制約項と確率的行列分解を用いた独立性強化型推薦システムについて述べる.二つの分布の平均値のみを考慮するごく粗い近似により公平性を実装していたが,それに対して分布の二次以上のモーメントを考慮できる方法を2種類考案した.また,この拡張の有効性を示す実験を行った. 二つ目の潜在意味分析モデルとは,自然言語処理や情報検索の分野で用いられる次元削減手法の一つである.この潜在意味分析モデルは従来より,評価値の予測ができるように拡張され推薦システムに適用されてきた.今回は,この新たな推薦モデルについても公平性が実現できるようなモデルベースの手法を提案しICDMのワークショップにて発表した. 最後の後処理を用いた方法は,分類問題を対象とした機会学習における公平性の実現では広く用いられている方法の一つである.公平性の実現手法には,データを事前に変換する前処理型,学習時に同時に公平性を実現する中処理型,そして学習したモデルを後から変換する後処理型とがある.今までの上記二つの方針は中処理型であるが,ベースラインとして簡潔な後処理型でどれだけの性能が実現できるか,今まで未検証であった.そのため,予測値の平均と標準偏差を修正する後処理型を実装し,今までの中処理型と比較実験を行った.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
公平性制約項を用いた推薦システムの手法については,論文にまとめたが,受理されなかった.認められなかった有効性に対して,エビデンスをより強めるため,関連するモデルベースの手法や後処理型を考案した.
|
Strategy for Future Research Activity |
公平性制約項を用いた独立性強化型推薦システムの有効性を示す追加実験を行い,論文として出版したい.そのために,昨年度,新たに開発したモデルベースや後処理型の手法との比較実験追加や,潜在意味分析モデルに公平性制約項を追加したモデルなどの追加実験を行い,提案手法の有効性を示すエビデンスを示す実験を行う.
|