研究概要 |
平成20年度は分散した秘密情報によって定義される組み合わせ最適化および強化学習に関する研究を行った。 組み合わせ最適化問題では、問題を定義するインスタンスをプライバシーとみなし、このような秘密の分割インスタンスによって定義される一般の組み合わせ最適化問題を、整数計画問題を経由し、局所探索や遺伝的アルゴリズムなどによって解くアルゴリズムを開発した。また構成されたプロトコルが各エージェントの秘密情報を確かに漏えいしないことを, 定理として証明し, セキュリティを保証した。この研究は2007年に遺伝的アルゴリズムにおいて最も大規模な国際会議であるGECCOで発表したアルゴリズムの一般化であり、2008年12月に進化計算研究会で発表した。またこの研究について、IEEE CISJ Young Researcher Awardを受賞した。 強化学習では、マルコフ決定過程における状態・報酬観測、行動出力の分割モデルを各エージェントのプライバシーとみなし、定義されたプライバシーおよび分割モデルに対応したマルコフ決定過程のためのプライバシアウェアな強化学習法を開発した。また構成されたプロトコルが, 各エージェントの秘密情報を確かに漏えいしないことを, 定理として証明し, セキュリティを保証した。この研究は米国Rutgers大学との共同研究として行われ、機械学習にて最も権威ある国際会議であるICML2008に採録され、2008年7月にヘルシンキにて発表された。
|