研究課題/領域番号 |
15J09850
|
研究種目 |
特別研究員奨励費
|
配分区分 | 補助金 |
応募区分 | 国内 |
研究分野 |
知能情報学
|
研究機関 | 東京大学 |
研究代表者 |
小宮山 純平 東京大学, 情報理工学系研究科, 特別研究員(DC2)
|
研究期間 (年度) |
2015-04-24 – 2017-03-31
|
研究課題ステータス |
採択後辞退 (2016年度)
|
配分額 *注記 |
1,700千円 (直接経費: 1,700千円)
2016年度: 800千円 (直接経費: 800千円)
2015年度: 900千円 (直接経費: 900千円)
|
キーワード | 多腕バンディット問題 / 確率的最適化 / 探索と活用のトレードオフ / コールドスタート問題 / 情報推薦 / 情報検索 / ウェブデータ活用 / 大規模データ処理 |
研究実績の概要 |
本年度は、機械学習・学習理論分野で3本の論文が採択され、研究結果を発表した。これらの発表は、システムの未知のパラメータ(推薦すべきデータの性質に依存した不確定性)を効率的に学習できる確率的バンディット問題という共通の数理的基盤を持ちながら、複数の問題への応用範囲を持った内容となっている。 1本目の論文(ICML2015で発表)はオンライン広告の推薦、2本目の論文(COLT2015で発表)は検索エンジンのランキング最適化を目的とし、いずれも実データを基にしたシミュレーションで既存手法の1/5から1/10のデータで学習が行える、また計算効率も良い手法の提案となっている。 3本目の論文(NIPS2015で発表)は、これらの問題にひそむ共通のデータ構造に関する研究を行い、前述の2論文をを含む広いクラスの問題に対する推薦アルゴリズム(PM-DMED,部分モニタリング経験尤度最小化法)を提案した。このアルゴリズムは少ないデータサイズで情報理論的に最適な推薦を行うことができる。ユーザに対してどのようなコンテンツを推薦すればよいかに関して、ウェブサービスのようなフィードバック(ユーザのアクション)を観測できるような推薦をうまく動かし、ユーザの望むコンテンツを提示することができる。 これらの論文はいずれも関連分野のトップ国際会議での発表であり、データを逐次学習する機械学習研究の最先端のものであると考える。
|
現在までの達成度 (段落) |
翌年度、交付申請を辞退するため、記入しない。
|
今後の研究の推進方策 |
翌年度、交付申請を辞退するため、記入しない。
|