2015 Fiscal Year Annual Research Report
Project/Area Number |
25330261
|
Research Institution | Kyushu University |
Principal Investigator |
畑埜 晃平 九州大学, 附属図書館, 准教授 (60404026)
|
Project Period (FY) |
2013-04-01 – 2016-03-31
|
Keywords | オンライン予測 / 機械学習 / スケジューリング / ランキング / オンライン密度推定 / 離散最適化 |
Outline of Annual Research Achievements |
1.順序に関する確率モデルの1つである Bradley-Terry モデルに対するオンライン密度推定手法を開発した.Bradley-Terry モデルとは,複数チームの勝敗に関する確率モデルであり,近年,ランキング学習や推薦アルゴリズムの重要性が増した事により,注目を集めている.このモデルに対するオンライン密度推定問題は,オンライン予測における標準的な枠組みであるオンライン凸最適化で定式化できるが,パラメータの空間の“半径”が過大に見積もられるために,リグレット解析が不十分であった.本研究では半径の厳密な解析を通して,従来手法の新たなリグレット評価を与えると共に,よりよいリグレット限界を持つ新手法を提案した.なお,本成果は学習理論のトップ国際会議であるCOLTに受理された. 2.順序制約下でのオンラインスケジューリング手法を開発した.順序制約下でのスケジューリング問題はオフライン設定ではさかんに研究されている.コストが事前に不明であるオンライン設定においては,問題はより困難となり,これまで研究がなされてこなかった.例外として,オフライン最適化手法をオンライン最適化手法に変換する(オフラインーオンライン変換)方法が知られているが,リグレット評価は劣る.本研究では,申請者らが独自に培ってきた置換多面体の幾何学的性質の知見を活かし,効率的なオンライン最適化手法を開発した.本成果は学習理論の国際会議ALTに受理された. 3.その他に,相対評価に基づく協調ランキング問題や強化学習におけるオンライン凸最適化,等の研究を行った.
|
Research Products
(12 results)