平成21年度は平成20年度で扱った分散秘密情報源からの最適化にかえ、分散秘密情報源からの学習問題に取り組んだ。具体的には、分散した秘密情報によって定義される分類器学習における特徴選択・モデル選択に冠する研究を行った。 プライバシ保護型分類機学習は、秘密分散情報源の和集合から、これらを実際に共有することなく分類器を学習する枠組みである。従来のプライバシ保護データマイニングでは既存のマイニングアルゴリズムのプライバシ保護化に重点が置かれていた。一方でデータマイナーの課題は特定のマイニングアルゴリズムの実行にとどまらず、その前処理・後処理も、同様に重要である。 分類機学習の前処理・後処理としてはそれぞれ特徴選択とモデル選択が分類性能向上のための重要である。そこで、秘密情報源から作成された分類器より、データの秘密をあかさずに分類性能を評価することができるHamming distanceプロトコルを提案し、安全な分類性能評価法を確立した。またこれに基づき、実際にプライバシ保護データマイニングの前処理・後処理として、k-fold cross validationを通じたプライバシ保護特徴選択・モデル選択を単純ベイズ分類器やサポートベクターマシンに適用し、その有効性を検証した。
|