• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2015 Fiscal Year Annual Research Report

ランダムサンプリングに基づくオンライン意思決定

Research Project

Project/Area Number 15H02667
Research InstitutionKyushu University

Principal Investigator

瀧本 英二  九州大学, システム情報科学研究科(研究院, 教授 (50236395)

Co-Investigator(Kenkyū-buntansha) 畑埜 晃平  九州大学, 附属図書館, 准教授 (60404026)
Project Period (FY) 2015-04-01 – 2019-03-31
Keywords計算学習理論 / オンラインアルゴリズム / 組合せ最適化
Outline of Annual Research Achievements

主に以下の3つの成果を得た.
1.組合せ集合を決定空間とするオンライン予測の問題に対し,その集合上の線形最適化問題がNP困難であっても,高効率・高性能な予測アルゴリズムを持つための新しい十分条件を与えた.これまで,「射影および乱択ラウンディングが効率よく解けるような緩和空間を持つこと」という十分条件が知られていたが,本研究ではこれを,階層的な緩和空間に対する条件に緩めることができることを示した.さらに,本手法が適用できる事例として,順序制約つきのオンラインジョブスケジューリング問題に対する高効率・高性能なオンライン予測アルゴリズムを与えた.
2.オンライン線形回帰問題に対し,事例ベクトルの系列が予め与えられているという状況のもとで,厳密に最適なリグレット性能を持つ効率の良いアルゴリズムを設計することに成功した.これは,ミニマックス解析によるものであり,各試行において予測する回帰超平面は,本来,それ以降の最悪なラベル系列に対してリグレットを最小にするものとして求めることができるのであるが,極めて興味深いことに,提案アルゴリズムは,その最悪なラベル系列を推定することなく超平面を求めることができる.従って,提案アルゴリズムは,ラベル空間の大きさに依存せず常に最適性を保証するという特長を持つ.
3.ランキングの推定などに幅広い応用を持つ,Bradley-Terryモデルと呼ばれる確率モデルのオンライン最尤推定問題に対し,高効率・高性能なアルゴリズムを与えた.この問題は,パラメータ空間の直径が無限大になるため,従来のリグレット解析を用いると,有限のリグレット限界を導出することができない.本手法では,仮想試行に基づく新しい正則化項を導入することにより,自明でないリグレット限界を導入すつることに成功している.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

学習理論に関する最高峰・最難関の国際会議であるConference on Learning Theory (COLT) で,2つの研究成果を発表することができた.

Strategy for Future Research Activity

研究計画として掲げている2つの項目
1.乱択ラウンディングに基づく離散決定空間に対するオンライン予測
2.ランダムサンプリングによるオンライン意思決定法の開発
について,引き続き多角的な視点から研究を行う.
また,本研究課題の基礎を支えている,学習理論および最適化の分野の世界的権威である,Elad Hazan氏を招聘して,共同研究を行うための準備をすすめている.

  • Research Products

    (15 results)

All 2016 2015 Other

All Int'l Joint Research (3 results) Journal Article (4 results) (of which Int'l Joint Research: 2 results,  Peer Reviewed: 4 results,  Acknowledgement Compliant: 3 results,  Open Access: 3 results) Presentation (8 results)

  • [Int'l Joint Research] University of California, Santa Cruz/University of California, Berkeley(米国)

    • Country Name
      U.S.A.
    • Counterpart Institution
      University of California, Santa Cruz/University of California, Berkeley
  • [Int'l Joint Research] Queensland University of Technology(オーストラリア)

    • Country Name
      AUSTRALIA
    • Counterpart Institution
      Queensland University of Technology
  • [Int'l Joint Research] 天津科技大学(中国)

    • Country Name
      CHINA
    • Counterpart Institution
      天津科技大学
  • [Journal Article] An Online Policy Gradient Algorithm for Continuous State and Action Markov Decision Processes2016

    • Author(s)
      Yao Ma, Tingting Zhao, Kohei Hatano, Masashi Sugiyama
    • Journal Title

      Neural Computation

      Volume: 28 Pages: 563-593

    • DOI

      10.1162/NECO_a_00808

    • Peer Reviewed / Open Access / Int'l Joint Research / Acknowledgement Compliant
  • [Journal Article] Online Linear Optimization for Job Scheduling under Precedence Constraints2015

    • Author(s)
      Takahiro Fujita, Kohei Hatano, Shuji Kijima, Eiji Takimoto
    • Journal Title

      Proc. 26th International Conference on Algorithmic Learning Theory (ALT 2015), Lecture Notes in Artificial Intelligence

      Volume: 9355 Pages: 332-346

    • DOI

      10.1007/978-3-319-24486-0_22

    • Peer Reviewed / Acknowledgement Compliant
  • [Journal Article] Minimax Fixed-Design Linear Regression2015

    • Author(s)
      Peter Bartlett, Wouter Koolen, Alan Malek, Eiji Takimoto, Manfred Warmuth
    • Journal Title

      Proceedings of The 28th Conference on Learning Theory (COLT 2015), JMLR: Workshop and Conference Proceedings

      Volume: 40 Pages: 226-239

    • Peer Reviewed / Open Access / Int'l Joint Research
  • [Journal Article] Online Density Estimation of Bradley-Terry Models2015

    • Author(s)
      Issei Matsumoto, Kohei Hatano, Eiji Takimoto
    • Journal Title

      Proceedings of The 28th Conference on Learning Theory (COLT 2015), JMLR: Workshop and Conference Proceedings

      Volume: 40 Pages: 1343-1359

    • Peer Reviewed / Open Access / Acknowledgement Compliant
  • [Presentation] 相対評価に基づく協調ランキング問題2016

    • Author(s)
      森富賢一郎, 畑埜晃平, 瀧本英二
    • Organizer
      電子情報通信学会IBISML 研究会
    • Place of Presentation
      統計数理研究所(東京都・立川市)
    • Year and Date
      2016-03-17
  • [Presentation] 累積的でない損失関数に対するオンライン予測2016

    • Author(s)
      森和香菜, 畑埜晃平, 瀧本英二
    • Organizer
      冬のLAシンポジウム
    • Place of Presentation
      京都大学(京都府・京都市)
    • Year and Date
      2016-01-26
  • [Presentation] 相対評価に基づく協調ランキング問題2015

    • Author(s)
      森富賢一郎, 畑埜晃平, 瀧本英二
    • Organizer
      第18回情報論的学習理論ワークショップ (IBIS2015)
    • Place of Presentation
      つくば国際会議場(茨城県・つくば市)
    • Year and Date
      2015-11-26
  • [Presentation] 特徴と標本の同時セーフスクリーニン グ2015

    • Author(s)
      柴垣篤志, 小川晃平, 畑埜晃平, 竹内一郎
    • Organizer
      第18回情報論的学習理論ワークショップ (IBIS2015)
    • Place of Presentation
      つくば国際会議場(茨城県・つくば市)
    • Year and Date
      2015-11-26
  • [Presentation] しきい値回路による特徴写像2015

    • Author(s)
      坂口慶介, 内澤啓, 瀧本英二
    • Organizer
      夏のLAシンポジウム
    • Place of Presentation
      ゆのくに天祥(石川県・加賀市)
    • Year and Date
      2015-07-16
  • [Presentation] マハラノビス距離のオンライン予測2015

    • Author(s)
      森富賢一郎, 畑埜晃平, 瀧本英二
    • Organizer
      夏のLAシンポジウム
    • Place of Presentation
      ゆのくに天祥(石川県・加賀市)
    • Year and Date
      2015-07-15
  • [Presentation] 離散最適化問題に対するZDD構築2015

    • Author(s)
      松本晃輔, 畑埜晃平, 瀧本英二
    • Organizer
      夏のLAシンポジウム
    • Place of Presentation
      ゆのくに天祥(石川県・加賀市)
    • Year and Date
      2015-07-14
  • [Presentation] Bradley-Terry モデルのオンライン密度推定2015

    • Author(s)
      松本一成, 畑埜晃平, 瀧本英二
    • Organizer
      電子情報通信学会IBISML 研究会
    • Place of Presentation
      沖縄科学技術大学院大学(沖縄県・恩納村)
    • Year and Date
      2015-06-25

URL: 

Published: 2017-01-06   Modified: 2022-02-02  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi