研究課題/領域番号 |
23K13011
|
研究機関 | 筑波大学 |
研究代表者 |
福地 一斗 筑波大学, システム情報系, 助教 (30838090)
|
研究期間 (年度) |
2023-04-01 – 2026-03-31
|
キーワード | 公平性 / demographic parity / minimax最適 |
研究実績の概要 |
機械学習アルゴリズムによって構築された予測モデルが性別や人種などのセンシティブな属性によって出力を変えるような差別的な振る舞いをすることが指摘されてきている.それを解決するために,センシティブ属性によるバイアスを排除する機構を組み込んだ公平な学習アルゴリズムが開発されてきた.それらのアルゴリズムによって差別の排除の実現は可能であるが,効率的に与えられたサンプルを活用できているか解明されておらず,差別の排除をしつつより高い精度の予測を行える可能性があった.本研究では,最も予測精度の高い公平な学習アルゴリズムの開発を行い,その最適性を数理的に検証する.特に,demographic parityと呼ばれる公平性定義を保証する学習問題に対して最悪ケース誤差が最も小さい学習アルゴリズムの解明を行なった.既存の研究では,従属変数にセンシティブ属性に依存した項が存在し,それのみによってバイアスが発生するデータ生成分布のモデルにおける最適な予測精度の解明が行われていた.このモデルは従属変数の平均がセンシティブ属性に依存して変わる状況を捉えることが可能であったが,分散などの公示モーメントが変化する状況は対応していなかった.本研究では,従属変数の分散がセンシティブ属性に依存し,かつ,独立変数の平均もセンシティブ属性に依存するようなデータ生成分布のモデルにおける最適なアルゴリズムを解明した.既存の理論では最適な予測精度は公平性を要求しない一般的な回帰問題と変わりなかったが,今回の解析ではセンシティブ属性による分散が異なるほど公平性を達成することが難しく,最適な予測精度も上昇することがわかった.これにより,一般的な回帰問題とは異なる公平性の問題特有の難しさの解明を行った.この研究の成果は機械学習のtop tierの会議であるNeurIPS2023に採択された.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
今年度は線形なデータ生成分布のモデルを仮定した上での最適な公平性を保証した学習アルゴリズムの構築する予定であった.この目標はある程度達成でき,その成果がNeurIPS2023の論文として採択された.よって,現状概ね順調に進展していると考える.
|
今後の研究の推進方策 |
今後はこれまでの理論をもとに,データ生成分布のモデルにおいて,独立変数と従属変数間の関係が非線形であったり,センシティブ属性と従属変数間の関係が複雑である場合における最適な公平性を保証したアルゴリズムの構築を行う.現状の解析で行えている,データ自身に含まれているバイアスの解析を非線形な関係に展開することはそこまで大きな課題もなく達成可能であると考えている.一方,アルゴリズム自身がバイアスを発生させる現象の解析が現状はできていない.この現象の解析も含めて進めていきたいと考えている.
|
次年度使用額が生じた理由 |
共同で研究室を運営していた教授の他大学への栄転などの研究室の状況が大きく変わり,申請書で記載した複雑なモデルでの実験をするためのサーバーの購入などに遅れが生じたため.今年度序盤でサーバーの購入で助成金を使用予定である.
|