2015 Fiscal Year Research-status Report
データマイニングにおける中立・公正性に配慮するデータ変換技術
Project/Area Number |
15K00327
|
Research Institution | National Institute of Advanced Industrial Science and Technology |
Principal Investigator |
神嶌 敏弘 国立研究開発法人産業技術総合研究所, 人間情報研究部門, 主任研究員 (50356820)
|
Co-Investigator(Kenkyū-buntansha) |
赤穗 昭太郎 国立研究開発法人産業技術総合研究所, 人間情報研究部門, 研究グループ長 (40356340)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | 公正性 / プライバシ / トピックモデル / 推薦システム |
Outline of Annual Research Achievements |
今年度は次元削減とトピックモデルを対象とした研究双方について研究をすすめた. 人工知能学会全国大会における発表はこのうち後者のトピックモデルに関するものである.モデル上での統計的独立性を導入することで公正性を達成できる可能性を調査した結果を報告した.調査の結果,主観的に把握できるような変化を見いだせなかった.影響の定量的な計測やモデル上だけではない独立性の考慮が課題である. ICMLワークショップにおける招待講演では,本課題である公正配慮のためのデータ変換技術を含めた公正配慮型データマイニング全体の展望について,いろいろな可能性を論じた.より詳細には,従来の分類における公正性以外への応用の可能性,公平分割,公正性の規準などの観点についてである. 最後に推薦を目的とした確率的行列分解法について,従来の方法を改良し,分布の2次以上のモーメントを考慮した手法を考案した.これにより,一層厳密に公正性を保つ行列分解が可能となった.現在,英文論文誌に投稿中である.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
27年度の計画では (1) 推薦を対象とした行列分解の公正配慮化 と (2) 公正配慮型トピック抽出の検討 の2点について研究を行う計画であった. (1) については,既存の確率的行列分解法に公正性を保つための制約項を導入する手法についての研究である.ここで,従来では分布の1次モーメントのみを考慮していたが,2次モーメントまでを考慮することで,より厳密に公正性を達成できるよう改良した.実験結果をまとめ,現在,英文論文誌に投稿中である. (2) については,最も基礎的な公正性モデルであるモデル上での分布の公正化を実行した.これはトピックモデルで,センシティブな特徴と,トピックを表す変数との分布を独立にするものである.このような問題をEMアルゴリズムを適用して解くようにした.実験の結果から,主観的な評価では公正性の効果は十分には検証できなかた.
|
Strategy for Future Research Activity |
確率的行列分解法の改良については既に投稿中であるため,照会に対する対応などを続ける. トピックモデルについては,単純なトピックの抽出だけでなく,推薦に利用できる,予測スコアの分布モデルを加えたタイプのトピックモデルへの拡張を模索している.研究計画で述べたような,上記確率的行列分解法で用いた連続分布ではなく,多項分布を対象とした独立性制約の開発に注力したい.
|