本年度は、機械学習・学習理論分野で3本の論文が採択され、研究結果を発表した。これらの発表は、システムの未知のパラメータ(推薦すべきデータの性質に依存した不確定性)を効率的に学習できる確率的バンディット問題という共通の数理的基盤を持ちながら、複数の問題への応用範囲を持った内容となっている。 1本目の論文(ICML2015で発表)はオンライン広告の推薦、2本目の論文(COLT2015で発表)は検索エンジンのランキング最適化を目的とし、いずれも実データを基にしたシミュレーションで既存手法の1/5から1/10のデータで学習が行える、また計算効率も良い手法の提案となっている。 3本目の論文(NIPS2015で発表)は、これらの問題にひそむ共通のデータ構造に関する研究を行い、前述の2論文をを含む広いクラスの問題に対する推薦アルゴリズム(PM-DMED,部分モニタリング経験尤度最小化法)を提案した。このアルゴリズムは少ないデータサイズで情報理論的に最適な推薦を行うことができる。ユーザに対してどのようなコンテンツを推薦すればよいかに関して、ウェブサービスのようなフィードバック(ユーザのアクション)を観測できるような推薦をうまく動かし、ユーザの望むコンテンツを提示することができる。 これらの論文はいずれも関連分野のトップ国際会議での発表であり、データを逐次学習する機械学習研究の最先端のものであると考える。
|