2013 Fiscal Year Research-status Report

社会的公正性に配慮したデータマイニング技術

Research Project

Project/Area Number	24500194
Research Institution	National Institute of Advanced Industrial Science and Technology
Principal Investigator	神嶌敏弘独立行政法人産業技術総合研究所, ヒューマンライフテクノロジー研究部門, 主任研究員 (50356820)
Co-Investigator(Kenkyū-buntansha)	赤穗昭太郎独立行政法人産業技術総合研究所, ヒューマンライフテクノロジー研究部門, 研究グループ長 (40356340)
Keywords	公正性 / 中立性 / 統計的独立性 / データマイニング / 機械学習 / 推薦システム / フィルターバブル
Research Abstract	本研究の目的は，公正性・中立性に配慮したデータマイニング技術を開発することにある．データマイニング技術は，与信や採用といった重要な決定にも関与している．このとき，性別・人種・出生などの社会的公正性の観点から利用すべきでない情報の関与を排除すべきである．これには，単純にこれらの情報をモデルから除外するだけでは不十分であることが知られている．例えば，特定の人種が，特定の区域に住んでいる場合，これらの情報には高い相関が生じ，人種という情報を除外しても，居住区域の情報から間接的に差別的な判断がなされることがあり，これをred-lining効果という．このような判断を回避するために，本研究では，与信や採用などの決定事項と，性別・人種など配慮を要する情報との間の統計的独立性を保証することで，こうした公正性を確保する分析モデルを研究している．前年度は統計的独立性を制約項として組み込む拡張をロジスティック回帰分類モデルに対して行った．しかし，公正性の達成度に関しては，後処理で公正性を強化する既存手法に劣っていた．この問題に対し理論面から解析を行い，モデルバイアスや，決定則の影響を明らかにした．そして，その問題を解消したモデルを考案することで，既存のヒューリスティックな公正性強化手法の数理モデルを明らかにし，理論基盤を強化した．前年度は利用者に提供する情報の中立性を強化する情報中立推薦システムを提案していた．中立性は提案モデルにて強化できることは示せたが，計算が困難なモデルを採用しており，処理できるデータの規模が非常に小さいという問題があった．今年度はモデルの簡素化を行うことで，公正性を悪化させることなく，大規模なデータを処理できような改良を行った．
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason 2013年度の計画では，2011年度に続いてアルゴリズムと理論面の改良を行う予定であった．アルゴリズムの側面からは，中立に配慮した推薦システム（情報中立推薦システム）の改良をであったが，中立性・公正性を保証するための制約項を改良することで，目標のとおり大幅に効率を改善できた．今までは，1万件規模のデータしか処理できなかったが，5万～800万規模のデータまでを実際に処理することができ，また，中立性に関しても大きな損失はなかった．このように，予定どおりアルゴリズム面の改良を達成できた．理論面においては，提案しているロジスティック回帰を公正化したモデルが，既存の単純ベイズ法に基づくモデルに対し，公正性と予測精度のトレードオフにおいてまだ差がある問題について取り組む予定であった．この点について，モデルバイアスと決定則の影響を明らかにし，ヒューリスティックではあるが高い公正性を達成していた既存手法に対して，その数理モデルを明確にした．さらに，その数理モデルに基づいた手法を実装し，既存手法と比較し同等な性能を実際に示せたことから，実験的にも提案した数理モデルの正当性を示すことができた．
Strategy for Future Research Activity	2014年度も，公正配慮型分類と情報中立推薦の両方の改良をめざす．公正配慮型分類では，高い公正性を達成するために，モデルバイアスと決定則の影響を取り除いた数理モデルを開発した．このモデルを生成モデル型の手法に適応したアルゴリズムを提案していたが，この考えを他の分類モデルにも拡張する．具体的には，識別モデルを用いるロジスティック回帰と，識別関数を用いるサポートベクトルマシンである．さらに，高い公正性を達成するために，非センシティブ特徴に依存しない公正性ためのしきい値調整を，非センシティブ特徴を考慮することで，公正性と精度のよりよいトレードオフを実現したり，最適化の面を考慮した公正性制約項などの開発についても検討したい．もう一つの情報中立推薦では，大規模化までを達成した．しかし，推薦タスクのうち，適用できるのは利用者がアイテムを好む度合いを示す嗜好スコアの予測タスクだけであり，利用者の嗜好に適合するアイテムを，利用者が好んだアイテムのリストだけから予測して選択するタスクに対しては適用できない．このように適用可能な推薦タスクを広げたい．またより多様なタイプの非センシティブ特徴を扱ったり，より最適化が容易になるような定式化についても検討する．余力があれば，公正配慮型データマイニングを，教師ありの分類だけではなく，教師なしの手法に拡張することも検討したい．
Expenditure Plans for the Next FY Research Funding	購入価格が予測より安価であった書籍や論文などを購入し，情報収集のために充てる

Research Products
(8 results)

All 2014 2013 Other

All Journal Article (3 results) (of which Peer Reviewed: 3 results) Presentation (2 results) Book (1 results) Remarks (2 results)

[Journal Article] Absolute and Relative Clustering2013
- Author(s)
  T. Kamishima and S. Akaho
- Journal Title
  
  Proc. of the 4th MultiClust Workshop on Multiple Clusterings, Multi-view Data, and Multi-source Knowledge-driven Clustering
  
  Volume: なし
- DOI
  10.1145/2501006.2501013
- Peer Reviewed
[Journal Article] Efficiency Improvement of Neutrality-enhanced Recommendation2013
- Author(s)
  T. Kamishima, S. Akaho, H. Asoh, and J. Sakuma
- Journal Title
  
  Proc. of the 3rd Workshop on Human Decision Making in Recommender Systems
  
  Volume: なし
- Peer Reviewed
[Journal Article] The Independence of the Fairness-aware Classifiers2013
- Author(s)
  T. Kamishima, S. Akaho, H. Asoh, and J. Sakuma
- Journal Title
  
  Proc. of the 4th IEEE Int'l Workshop on Privacy Aspects of Data Mining
  
  Volume: なし Pages: 849-858
- DOI
  10.1109/ICDMW.2013.133
- Peer Reviewed
[Presentation] 情報中立推薦での中立性項の改良2013
- Author(s)
  神嶌敏弘，赤穂昭太郎，麻生英樹，佐久間淳
- Organizer
  電子情報通信学会第13回情報論的学習理論と機械学習(IBISML)研究会
- Place of Presentation
  東京都，早稲田大学　西早稲田キャンパス
- Year and Date
  20130718-20130718
[Presentation] 中立性・公正性に配慮したデータ分析2013
- Author(s)
  神嶌敏弘
- Organizer
  2013年度人工知能学会全国大会
- Place of Presentation
  富山県，富山市，富山国際会議場等
- Year and Date
  20130504-20130504
[Book] ビッグデータ・マネジメント --- データサイエンティストのためのデータ利活用技術と事例，3.2.1章2014
- Author(s)
  神嶌敏弘
- Total Pages
  7
- Publisher
  エヌ・ティー・エス出版
[Remarks] Fairness-Aware Data Mining (Soft & Data)
- URL
  http://www.kamishima.net/fadm/
[Remarks] Information-neutral Recommender Sys. (Soft & Data)
- URL
  http://www.kamishima.net/inrs/

2013 Fiscal Year Research-status Report

社会的公正性に配慮したデータマイニング技術

Principal Investigator

神嶌 敏弘 独立行政法人産業技術総合研究所, ヒューマンライフテクノロジー研究部門, 主任研究員 (50356820)

Current Status of Research Progress

Reason

Research Products

[Journal Article] Absolute and Relative Clustering2013

Author(s)

Journal Title

DOI

[Journal Article] Efficiency Improvement of Neutrality-enhanced Recommendation2013

Author(s)

Journal Title

[Journal Article] The Independence of the Fairness-aware Classifiers2013

Author(s)

Journal Title

DOI

[Presentation] 情報中立推薦での中立性項の改良2013

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] 中立性・公正性に配慮したデータ分析2013

Author(s)

Organizer

Place of Presentation

Year and Date

[Book] ビッグデータ・マネジメント --- データサイエンティストのためのデータ利活用技術と事例，3.2.1章2014

Author(s)

Total Pages

Publisher

[Remarks] Fairness-Aware Data Mining (Soft & Data)

URL

[Remarks] Information-neutral Recommender Sys. (Soft & Data)

URL

神嶌敏弘独立行政法人産業技術総合研究所, ヒューマンライフテクノロジー研究部門, 主任研究員 (50356820)