動的大規模データ環境における適応推薦

研究課題

研究課題/領域番号	15J09850
研究種目	特別研究員奨励費
配分区分	補助金
応募区分	国内
研究分野	知能情報学
研究機関	東京大学
研究代表者	小宮山純平東京大学, 情報理工学系研究科, 特別研究員(DC2)
研究期間 (年度)	2015-04-24 – 2017-03-31
研究課題ステータス	採択後辞退 (2016年度)
配分額 *注記	1,700千円 (直接経費: 1,700千円) 2016年度: 800千円 (直接経費: 800千円) 2015年度: 900千円 (直接経費: 900千円)
キーワード	多腕バンディット問題 / 確率的最適化 / 探索と活用のトレードオフ / コールドスタート問題 / 情報推薦 / 情報検索 / ウェブデータ活用 / 大規模データ処理
研究実績の概要	本年度は、機械学習・学習理論分野で３本の論文が採択され、研究結果を発表した。これらの発表は、システムの未知のパラメータ（推薦すべきデータの性質に依存した不確定性）を効率的に学習できる確率的バンディット問題という共通の数理的基盤を持ちながら、複数の問題への応用範囲を持った内容となっている。１本目の論文（ICML2015で発表）はオンライン広告の推薦、２本目の論文（COLT2015で発表）は検索エンジンのランキング最適化を目的とし、いずれも実データを基にしたシミュレーションで既存手法の1/5から1/10のデータで学習が行える、また計算効率も良い手法の提案となっている。３本目の論文（NIPS2015で発表）は、これらの問題にひそむ共通のデータ構造に関する研究を行い、前述の２論文をを含む広いクラスの問題に対する推薦アルゴリズム（PM-DMED，部分モニタリング経験尤度最小化法）を提案した。このアルゴリズムは少ないデータサイズで情報理論的に最適な推薦を行うことができる。ユーザに対してどのようなコンテンツを推薦すればよいかに関して、ウェブサービスのようなフィードバック（ユーザのアクション）を観測できるような推薦をうまく動かし、ユーザの望むコンテンツを提示することができる。これらの論文はいずれも関連分野のトップ国際会議での発表であり、データを逐次学習する機械学習研究の最先端のものであると考える。
現在までの達成度 (段落)	翌年度、交付申請を辞退するため、記入しない。
今後の研究の推進方策	翌年度、交付申請を辞退するため、記入しない。

報告書

(1件)

2015 実績報告書

研究成果
(13件)

すべて 2016 2015 その他

すべて雑誌論文 (3件) (うち査読あり 3件、オープンアクセス 3件、謝辞記載あり 3件) 学会発表 (8件) (うち国際学会 1件、招待講演 4件) 備考 (2件)

[雑誌論文] Optimal Regret Analysis of Thompson Sampling in Stochastic Multi-armed Bandit Problem with Multiple Plays2015
- 著者名/発表者名
  J. Komiyama, J. Honda, and H. Nakagawa
- 雑誌名
  
  Proceedings of the 32nd International Conference on Machine Learning
  
  巻: 1 ページ: 1152-1161
- 関連する報告書
  2015 実績報告書
- 査読あり / オープンアクセス / 謝辞記載あり
[雑誌論文] Regret Lower Bound and Optimal Algorithm in Dueling Bandit Problem2015
- 著者名/発表者名
  J. Komiyama, J. Honda, H. Kashima, and H. Nakagawa
- 雑誌名
  
  Proceedings of the 28th Annual Conference on Learning Theory
  
  巻: 1 ページ: 1141-1154
- 関連する報告書
  2015 実績報告書
- 査読あり / オープンアクセス / 謝辞記載あり
[雑誌論文] Regret Lower Bound and Optimal Algorithm in Finite Stochastic Partial Monitoring2015
- 著者名/発表者名
  J. Komiyama, J. Honda, and H. Nakagawa
- 雑誌名
  
  Proceedings of the 29th Neural Information Processing Systems
  
  巻: 1
- 関連する報告書
  2015 実績報告書
- 査読あり / オープンアクセス / 謝辞記載あり
[学会発表] 確率的バンディット問題の近年の研究動向について2016
- 著者名/発表者名
  小宮山純平
- 学会等名
  若手研究者のための大学間合同セミナー（STRセミナー）
- 発表場所
  北海道大学
- 年月日
  2016-03-21
- 関連する報告書
  2015 実績報告書
[学会発表] 部分モニタリング問題における漸近最適アルゴリズム2016
- 著者名/発表者名
  小宮山純平
- 学会等名
  統計学と機械学習における数理とモデリング（シンポジウム）
- 発表場所
  東京工業大学
- 年月日
  2016-02-21
- 関連する報告書
  2015 実績報告書
[学会発表] 確率的バンディット問題における効率的な学習アルゴリズム2015
- 著者名/発表者名
  小宮山純平
- 学会等名
  「学習とメカニズムデザイン」ワークショップ
- 発表場所
  九州大学
- 年月日
  2015-12-01
- 関連する報告書
  2015 実績報告書
- 招待講演
[学会発表] 比較バンディット問題における最適アルゴリズム2015
- 著者名/発表者名
  小宮山純平
- 学会等名
  第23回情報論的学習理論と機械学習研究会
- 発表場所
  つくば市（エポカルつくば）
- 年月日
  2015-11-25
- 関連する報告書
  2015 実績報告書
- 招待講演
[学会発表] 最適コンテンツ提示問題のための効率的なアルゴリズム2015
- 著者名/発表者名
  小宮山純平
- 学会等名
  日本応用数理学会年会
- 発表場所
  金沢大学
- 年月日
  2015-09-09
- 関連する報告書
  2015 実績報告書
- 招待講演
[学会発表] Regret Lower Bound and Optimal Algorithm in Dueling Bandit Problem2015
- 著者名/発表者名
  Junpei Komiyama
- 学会等名
  Machine Learning Summer School 2015 Kyoto
- 発表場所
  京都大学
- 年月日
  2015-08-23
- 関連する報告書
  2015 実績報告書
- 国際学会
[学会発表] Regret Lower Bound and Optimal Algorithm in Dueling Bandit Problem2015
- 著者名/発表者名
  小宮山純平
- 学会等名
  ERATO感謝祭SeasonII
- 発表場所
  国立情報学研究所（一橋講堂）
- 年月日
  2015-08-03
- 関連する報告書
  2015 実績報告書
- 招待講演
[学会発表] 比較バンディット問題における最適なアルゴリズム　～ランキング手法比較や選好情報学習を目的として～2015
- 著者名/発表者名
  小宮山純平、本多淳也、鹿島久嗣、中川裕志
- 学会等名
  第21回情報論的学習理論と機械学習研究会
- 発表場所
  沖縄科学技術大学院大学
- 年月日
  2015-06-23
- 関連する報告書
  2015 実績報告書
[備考] MultiBanditLib:a multi-play multi-armed bandit lib
- URL
  https://github.com/jkomiyama/multiplaybanditlib
- 関連する報告書
  2015 実績報告書
[備考] DuelingBanditLib: a simple dueling bandit library
- URL
  https://github.com/jkomiyama/duelingbanditlib
- 関連する報告書
  2015 実績報告書

動的大規模データ環境における適応推薦

研究代表者

小宮山 純平 東京大学, 情報理工学系研究科, 特別研究員(DC2)

1,700千円 (直接経費: 1,700千円)

報告書

研究成果

[雑誌論文] Optimal Regret Analysis of Thompson Sampling in Stochastic Multi-armed Bandit Problem with Multiple Plays2015

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Regret Lower Bound and Optimal Algorithm in Dueling Bandit Problem2015

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Regret Lower Bound and Optimal Algorithm in Finite Stochastic Partial Monitoring2015

著者名/発表者名

雑誌名

関連する報告書

[学会発表] 確率的バンディット問題の近年の研究動向について2016

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] 部分モニタリング問題における漸近最適アルゴリズム2016

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] 確率的バンディット問題における効率的な学習アルゴリズム2015

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] 比較バンディット問題における最適アルゴリズム2015

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] 最適コンテンツ提示問題のための効率的なアルゴリズム2015

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] Regret Lower Bound and Optimal Algorithm in Dueling Bandit Problem2015

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] Regret Lower Bound and Optimal Algorithm in Dueling Bandit Problem2015

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] 比較バンディット問題における最適なアルゴリズム ～ランキング手法比較や選好情報学習を目的として～2015

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[備考] MultiBanditLib:a multi-play multi-armed bandit lib

URL

関連する報告書

[備考] DuelingBanditLib: a simple dueling bandit library

URL

関連する報告書

小宮山純平東京大学, 情報理工学系研究科, 特別研究員(DC2)

[学会発表] 比較バンディット問題における最適なアルゴリズム　～ランキング手法比較や選好情報学習を目的として～2015