2013 Fiscal Year Research-status Report
Project/Area Number |
24500194
|
Research Institution | National Institute of Advanced Industrial Science and Technology |
Principal Investigator |
神嶌 敏弘 独立行政法人産業技術総合研究所, ヒューマンライフテクノロジー研究部門, 主任研究員 (50356820)
|
Co-Investigator(Kenkyū-buntansha) |
赤穗 昭太郎 独立行政法人産業技術総合研究所, ヒューマンライフテクノロジー研究部門, 研究グループ長 (40356340)
|
Keywords | 公正性 / 中立性 / 統計的独立性 / データマイニング / 機械学習 / 推薦システム / フィルターバブル |
Research Abstract |
本研究の目的は,公正性・中立性に配慮したデータマイニング技術を開発することにある.データマイニング技術は,与信や採用といった重要な決定にも関与している.このとき,性別・人種・出生などの社会的公正性の観点から利用すべきでない情報の関与を排除すべきである.これには,単純にこれらの情報をモデルから除外するだけでは不十分であることが知られている.例えば,特定の人種が,特定の区域に住んでいる場合,これらの情報には高い相関が生じ,人種という情報を除外しても,居住区域の情報から間接的に差別的な判断がなされることがあり,これをred-lining効果という. このような判断を回避するために,本研究では,与信や採用などの決定事項と,性別・人種など配慮を要する情報との間の統計的独立性を保証することで,こうした公正性を確保する分析モデルを研究している. 前年度は統計的独立性を制約項として組み込む拡張をロジスティック回帰分類モデルに対して行った.しかし,公正性の達成度に関しては,後処理で公正性を強化する既存手法に劣っていた.この問題に対し理論面から解析を行い,モデルバイアスや,決定則の影響を明らかにした.そして,その問題を解消したモデルを考案することで,既存のヒューリスティックな公正性強化手法の数理モデルを明らかにし,理論基盤を強化した. 前年度は利用者に提供する情報の中立性を強化する情報中立推薦システムを提案していた.中立性は提案モデルにて強化できることは示せたが,計算が困難なモデルを採用しており,処理できるデータの規模が非常に小さいという問題があった.今年度はモデルの簡素化を行うことで,公正性を悪化させることなく,大規模なデータを処理できような改良を行った.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
2013年度の計画では,2011年度に続いてアルゴリズムと理論面の改良を行う予定であった. アルゴリズムの側面からは,中立に配慮した推薦システム(情報中立推薦システム)の改良をであったが,中立性・公正性を保証するための制約項を改良することで,目標のとおり大幅に効率を改善できた.今までは,1万件規模のデータしか処理できなかったが,5万~800万規模のデータまでを実際に処理することができ,また,中立性に関しても大きな損失はなかった.このように,予定どおりアルゴリズム面の改良を達成できた. 理論面においては,提案しているロジスティック回帰を公正化したモデルが,既存の単純ベイズ法に基づくモデルに対し,公正性と予測精度のトレードオフにおいてまだ差がある問題について取り組む予定であった.この点について,モデルバイアスと決定則の影響を明らかにし,ヒューリスティックではあるが高い公正性を達成していた既存手法に対して,その数理モデルを明確にした.さらに,その数理モデルに基づいた手法を実装し,既存手法と比較し同等な性能を実際に示せたことから,実験的にも提案した数理モデルの正当性を示すことができた.
|
Strategy for Future Research Activity |
2014年度も,公正配慮型分類と情報中立推薦の両方の改良をめざす. 公正配慮型分類では,高い公正性を達成するために,モデルバイアスと決定則の影響を取り除いた数理モデルを開発した.このモデルを生成モデル型の手法に適応したアルゴリズムを提案していたが,この考えを他の分類モデルにも拡張する.具体的には,識別モデルを用いるロジスティック回帰と,識別関数を用いるサポートベクトルマシンである.さらに,高い公正性を達成するために,非センシティブ特徴に依存しない公正性ためのしきい値調整を,非センシティブ特徴を考慮することで,公正性と精度のよりよいトレードオフを実現したり,最適化の面を考慮した公正性制約項などの開発についても検討したい. もう一つの情報中立推薦では,大規模化までを達成した.しかし,推薦タスクのうち,適用できるのは利用者がアイテムを好む度合いを示す嗜好スコアの予測タスクだけであり,利用者の嗜好に適合するアイテムを,利用者が好んだアイテムのリストだけから予測して選択するタスクに対しては適用できない.このように適用可能な推薦タスクを広げたい.またより多様なタイプの非センシティブ特徴を扱ったり,より最適化が容易になるような定式化についても検討する. 余力があれば,公正配慮型データマイニングを,教師ありの分類だけではなく,教師なしの手法に拡張することも検討したい.
|
Expenditure Plans for the Next FY Research Funding |
購入価格が予測より安価であった 書籍や論文などを購入し,情報収集のために充てる
|