研究課題
1.順序に関する確率モデルの1つである Bradley-Terry モデルに対するオンライン密度推定手法を開発した.Bradley-Terry モデルとは,複数チームの勝敗に関する確率モデルであり,近年,ランキング学習や推薦アルゴリズムの重要性が増した事により,注目を集めている.このモデルに対するオンライン密度推定問題は,オンライン予測における標準的な枠組みであるオンライン凸最適化で定式化できるが,パラメータの空間の“半径”が過大に見積もられるために,リグレット解析が不十分であった.本研究では半径の厳密な解析を通して,従来手法の新たなリグレット評価を与えると共に,よりよいリグレット限界を持つ新手法を提案した.なお,本成果は学習理論のトップ国際会議であるCOLTに受理された.2.順序制約下でのオンラインスケジューリング手法を開発した.順序制約下でのスケジューリング問題はオフライン設定ではさかんに研究されている.コストが事前に不明であるオンライン設定においては,問題はより困難となり,これまで研究がなされてこなかった.例外として,オフライン最適化手法をオンライン最適化手法に変換する(オフラインーオンライン変換)方法が知られているが,リグレット評価は劣る.本研究では,申請者らが独自に培ってきた置換多面体の幾何学的性質の知見を活かし,効率的なオンライン最適化手法を開発した.本成果は学習理論の国際会議ALTに受理された.3.その他に,相対評価に基づく協調ランキング問題や強化学習におけるオンライン凸最適化,等の研究を行った.
すべて 2016 2015 その他
すべて 国際共同研究 (1件) 雑誌論文 (3件) (うち査読あり 3件、 謝辞記載あり 3件、 オープンアクセス 2件) 学会発表 (7件) 備考 (1件)
Neural Computation
巻: vol.28, No.3 ページ: 563-593
10.1162/NECO_a_00808
Proceedings of the 28th Conference on Learning Theory (COLT 2015)
巻: MLR W&CP 40 ページ: 1343-1359
Proceedings of 26th International Conference on Algorithmic Learning Theory (ALT 2015)
巻: LNCS 6331 ページ: 345-359
10.1007/978-3-319-24486-0_22
http://www.i.kyushu-u.ac.jp/~hatano/pubs.html