2012 Fiscal Year Research-status Report
Project/Area Number |
24500194
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Research Institution | National Institute of Advanced Industrial Science and Technology |
Principal Investigator |
神嶌 敏弘 独立行政法人産業技術総合研究所, ヒューマンライフテクノロジー研究部門, 主任研究員 (50356820)
|
Co-Investigator(Kenkyū-buntansha) |
赤穗 昭太郎 独立行政法人産業技術総合研究所, ヒューマンライフテクノロジー研究部門, 研究グループ長 (40356340)
|
Project Period (FY) |
2012-04-01 – 2015-03-31
|
Keywords | 公正性 / 中立性 / 統計的独立性 / データマイニング / 機械学習 / 推薦システム / フィルターバブル |
Research Abstract |
本研究の目的は,公正性・中立性に配慮したデータマイニング技術を開発することにある.データマイニング技術は,与信や採用といった重要な決定にも関与している.このとき,性別・人種・出生などの社会的公正性の観点から利用すべきでない情報の関与を排除すべきである.これには,単純にこれらの情報をモデルから除外するだけでは不十分であることが知られている.例えば,特定の人種が,特定の区域に住んでいる場合,これらの情報には高い相関が生じ,人種という情報を除外しても,居住区域の情報から間接的に差別的な判断がなされることがあり,これをred-lining効果という. このような判断を回避するために,本研究では,与信や採用などの決定事項と,性別・人種など配慮を要する情報との間の統計的独立性を保証することで,こうした公正性を確保する分析モデルを研究している.ここでは特に,統計的独立性を相互情報量によって定量化し,それをロジスティック回帰による分類モデルと組み合わせる方法について取り組んでいる. 今までの予備実験では,このようなモデルを構成して実験を行ってきた.しかし,モデルの非凸性などの問題のため最適化は困難だった.本年度は,初期化を工夫することにより,最適化の不安定さを大きく取り除く改良を行った. また,上記の社会的公正性の他に,利用者に提供する情報の中立性に関しても,同様のモデルをするアイデアも開発した.こうした問題は推薦システムにおける情報の偏向としてフィルターバブル問題とも関連し,注目されている.本年度は,確率的行列分解モデルにこの中立性を確保するため仕組みを,社会的公正性と同様のモデリングにより実装する予備実験を行った.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
2012年度の計画では,アルゴリズムの改良および,プライバシ保護データマイニング技術との関連について理論面での向上を図る予定であった. アルゴリズムの改良については,独立性の制約の定式化,最適化の不安定性の解消,精度と公正性のトレードオフに関して研究する予定であった.このうち,独立性の制約の定式化を変える部分については特に大きな進展はなかった.二つ目の最適化の不安定性の解消については,初期化において公正性を考慮しない通常の分類結果を利用するアイデアにより大きく改善することができた.この最適化の改良は,三つ目の目標を副次的に改善することができトレードオフの効率改善に寄与した.一つ目の問題点以外については十分に目標を達成できた. プライバシ保護データマイニング技術との関連については,統計的独立性の観点から先入観 (prejudice) の概念を考案し,それらを場合によって,直接・間接・潜在と細分化する定義を行った.これらの概念が,属性情報を保護する場合のプライバシ保護データマイニングと関連することを明らかにした.以上のことから,この点について概ね目標を達成できた. 以上の問題の他に,計画にはなかった情報の中立性に配慮した推薦システムへの,公正配慮型データマイニング技術の適用を行った.予備実験により,速度面に大きな課題は残るものの,公正性の改善を行うことができることを示した.この点については予定より進んだ.
|
Strategy for Future Research Activity |
2013年度は,引き続きアルゴリズム自体と,理論面での改良双方にを行う. 一つ目の点として,前年度予備実験を行った,公正配慮型データマイニング技術の情報中立に配慮した推薦システム(情報中立推薦システム)の改良を行う.2012年度の予備実験では,中立性については改善できたが,該当アルゴリズムはスケーラビリティにまだ重大な問題を抱えていた.そのため,実用的な規模のデータに対して適用することはできない問題があった.この問題に対し,中立性・公正性の定量化を行う項に工夫を行い,最適化が容易で,高速に計算できるものの採用を検討する.これにより,スケーラビリティに対する問題点に取り組む予定である. この中立性・公正性の定量化を行う項に関する研究は,前年度の改良点の中では検討しなかったもので,本年度にその改良を行う予定である.具体的には,相互情報量よりその計算が容易なダイバージェンスを導入することを考えている.これにより微分可能性や,最適化関数の凸性の問題の緩和などの問題点が解消できると考える. 理論面においては,提案しているロジスティック回帰を公正化したモデルが,既存の単純ベイズ法に基づくモデルに対し,公正性と予測精度のトレードオフにおいてまだ差がある問題について取り組む.このトレードオフが生じる要因を複数考えているが,それらについて理論とシミュレーションの両面から分析する.
|
Expenditure Plans for the Next FY Research Funding |
設備費:800,000円(実験用計算機) 海外旅費:500,000円 国内旅費:100,000円×2 英文校正:100,000円×2
|
Research Products
(6 results)
-
-
-
-
[Presentation] 情報中立推薦システム2012
Author(s)
神嶌 敏弘,赤穂 昭太郎,麻生 英樹,佐久間 淳
Organizer
人工知能学会全国大会
Place of Presentation
山口市,山口県教育会館他
Year and Date
20120612-20120615
-
-