2013 年度実績報告書

凸最適化の手法を用いたオンライン意思決定に関する研究

研究課題

研究課題/領域番号	23300003
研究機関	九州大学
研究代表者	瀧本英二九州大学, システム情報科学研究科(研究院, 教授 (50236395)
研究分担者	畑埜晃平九州大学, システム情報科学研究科(研究院, 助教 (60404026)
研究期間 (年度)	2011-04-01 – 2015-03-31
キーワード	オンライン予測 / LP緩和 / 近似アルゴリズム / モンテカルロ木探索 / ２部ランキング学習
研究概要	本研究では，意志決定とデータの提示が交互に繰り返される「オンライン意思決定」の問題に対し，アルゴリズムの設計と解析に関する一般的な方法論を確立することを目的としている．本年度は，主に，以下の３つの成果を得た．１．被覆集合族や充足割り当て集合など，線形最適化問題がNP困難であるような離散構造のクラスに対するアルゴリズムの設計に取り組んだ．その線形最適化問題が緩和に基づく多項式時間近似アルゴリズムを持つとき，その近似アルゴリズムを予測性能の良い多項式時間オンライン意思決定アルゴリズムに変換する一般的手法を与えた．特に，その変換アルゴリズムで重要な役割を果たすメタラウンディングが，緩和による近似問題の双対概念であることを見出し，さらに，その双対構造と，ブースティングによるマージン最大化問題に現れる双対構造との類似性から，ブースティングの手法を用いてメタラウンディングを実現する多項式時間アルゴリズムを与えた．２．ゲーム木におけるミニマックス探索法の一つに，モンテカルロ木探索が知られており，特にコンピュータ囲碁の分野で威力を発揮している．従来は，オンライン学習の分野で提案されたバンディットアルゴリズムを応用した手法が用いられていたが，本研究では，その探索効率を大幅に改善するアルゴリズムを与えた．３．近年，機械学習の手法を用いてコンピュータ将棋の盤面の評価関数を自動設計する手法が成果を上げ，プロ棋士を破るほどになっている．本研究では，この問題を２部ランキング学習の概念を用いて厳密に定式化し，性能が理論的に保証できる評価関数の学習方式を，初めて提案した．特に，従来の２部ランキング学習に「状態」の概念を導入することにより訓練サンプルのサイズを大幅に削減するとともに，オンライン学習の手法を用いて計算量を改善することに成功した．
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由研究実績の概要で上げた１つめの結果をはじめ，本研究課題で達成した，オンライン組み合わせ最適化問題に関する一連の成果が高く評価され，研究代表者と研究分担者は，本年度だけで計７件の招待講演を行っている．また，２つめの結果として示したモンテカルロ木探索に関する論文は，その論文が掲載されている電子情報通信学会英文論文誌E97-D(3)において，2014年4月15日現在，ダウンロード数が１位となっている．
今後の研究の推進方策	これまでの成果で得られた，オンライン組み合わせ最適化問題に関する知見を活用し，より一般的なオンライン意思決定問題に対する効率の良いアルゴリズムの開発を目指す．特に，最も基本的なオンライン意思決定問題の１つであるメトリカルタスクシステム問題に対し，その状態集合が組み合わせ論的に定義された指数サイズの離散構造のクラスである場合のアルゴリズムの効率化を図る．

研究成果
(19件)

すべて 2014 2013 その他

すべて雑誌論文 (4件) (うち査読あり 4件) 学会発表 (14件) (うち招待講演 7件) 図書 (1件)

[雑誌論文] Efficient Sampling Method for Monte Carlo Tree Search2014
- 著者名/発表者名
  Kazuki Teraoka, Kohei Hatano, Eiji Takimoto
- 雑誌名
  
  IEICE Transactions on Information and Systems
  
  巻: E97-D (3) ページ: 392-398
- DOI
  10.1587/transinf.E97.D.392
- 査読あり
[雑誌論文] SVMによる2 部ランキング学習を用いたコンピュータ将棋における評価関数の学習2014
- 著者名/発表者名
  末廣大貴, 畑埜晃平, 坂内英夫, 瀧本英二, 竹田正幸
- 雑誌名
  
  電子情報通信学会論文誌
  
  巻: J97-D (3) ページ: 593-600
- 査読あり
[雑誌論文] Efficient Algorithms for Combinatorial Online Prediction2013
- 著者名/発表者名
  Eiji Takimoto, Kohei Hatano
- 雑誌名
  
  Proc. 24th International Conference on Algorithmic Learning Theory (ALT 2013), Lecture Notes in Artificial Intelligence
  
  巻: 8139 ページ: 22-32
- DOI
  10.1007/978-3-642-40935-6_3
- 査読あり
[雑誌論文] Combinatorial Online Prediction via Metarounding2013
- 著者名/発表者名
  Takahiro Fujita, Kohei Hatano, Eiji Takimoto
- 雑誌名
  
  Proc. 24th International Conference on Algorithmic Learning Theory (ALT 2013), Lecture Notes in Artificial Intelligence
  
  巻: 8139 ページ: 68-82
- DOI
  10.1007/978-3-642-40935-6_6
- 査読あり
[学会発表] Combinatorial Online Prediction Using Online Approximation Algorithms
- 著者名/発表者名
  Takahiro Fujita，Kohei Hatano，Eiji Takimoto
- 学会等名
  The 6th Annual Meeting of the Asian Association for Algorithms and Computation (AAAC 2013)
- 発表場所
  ホテル松島大観荘
[学会発表] Combinatorial Online Prediction via Metarounding
- 著者名/発表者名
  Takahiro Fujita, Kohei Hatano, Eiji Takimoto
- 学会等名
  ICALP 2013 Satellite Workshop on Learning Theory and Complexity
- 発表場所
  University of Latvia, Riga, Latvia
[学会発表] Burgダイバージェンスを用いた行列のオンライン予測
- 著者名/発表者名
  森富賢一郎，畑埜晃平，瀧本英二
- 学会等名
  夏のLAシンポジウム
- 発表場所
  休暇村志賀島
[学会発表] Combinatorial Online Prediction by Continuous Relaxation
- 著者名/発表者名
  Eiji Takimoto
- 学会等名
  The Sixth Workshop on Information Theoretic Methods in Science and Engineering (WITMSE 2013)
- 発表場所
  東京大学
- 招待講演
[学会発表] Efficient Algorithms for Combinatorial Online Prediction
- 著者名/発表者名
  Eiji Takimoto, Kohei Hatano
- 学会等名
  The 24th International Conference on Algorithmic Learning Theory (ALT 2013)
- 発表場所
  National University of Singapore, Singapore
- 招待講演
[学会発表] Burgダイバージェンスを用いた行列のオンライン予測
- 著者名/発表者名
  森富賢一郎，畑埜晃平，瀧本英二
- 学会等名
  第16回情報論的学習理論ワークショップ (IBIS2013)
- 発表場所
  東京工業大学
[学会発表] BTモデルのオンライン推定に対するリグレット解析
- 著者名/発表者名
  松本一成，畑埜晃平，瀧本英二
- 学会等名
  第16回情報論的学習理論ワークショップ (IBIS2013)
- 発表場所
  東京工業大学
[学会発表] Lower Bounds for Linear Decision Trees via An Energy Complexity Argument
- 著者名/発表者名
  Eiji Takimoto
- 学会等名
  Computer Science Colloquia, CSpecial Lecture
- 発表場所
  Technion, Heifa, Israel
- 招待講演
[学会発表] Online Prediction with Bradley-Terry Models and Logistic Models
- 著者名/発表者名
  Issei Matsumoto, Kohei Hatano, Eiji Takimoto
- 学会等名
  電子情報通信学会　第16 回IBISML研究会
- 発表場所
  奈良女子大学
[学会発表] Online Matrix Prediction with Log- Determinant Regularizer
- 著者名/発表者名
  Kenichiro Moridomi, Kohei Hatano, Eiji Takimoto, Koji Tsuda
- 学会等名
  電子情報通信学会　第16 回IBISML研究会
- 発表場所
  奈良女子大学
[学会発表] オンライン予測理論とその応用
- 著者名/発表者名
  畑埜晃平
- 学会等名
  FIT 2013 企画セッション「ビッグデータ時代のオンライン学習アルゴリズム」
- 発表場所
  鳥取大学
- 招待講演
[学会発表] オンライン離散最適化
- 著者名/発表者名
  畑埜晃平
- 学会等名
  日本応用数理学会年会オーガナイズドセッション「機械学習」
- 発表場所
  アクロス福岡
- 招待講演
[学会発表] 離散構造のオンライン予測
- 著者名/発表者名
  畑埜晃平
- 学会等名
  IBIS2013 企画セッション「学習理論」
- 発表場所
  東京工業大学
- 招待講演
[学会発表] Combinatorial Online Prediction via Metarounding
- 著者名/発表者名
  Kohei Hatano
- 学会等名
  TCE Guest Lecture
- 発表場所
  Technion, Heifa, Israel
- 招待講演
[図書] 数学セミナー2013年12月号，特集「P≠NP予想最前線」2013
- 著者名/発表者名
  渡辺治，西村治道，垂井淳，岡本吉央，瀧本英二，吉田悠一，上原隆平
- 総ページ数
  36 (28-33)
- 出版者
  日本評論社

2013 年度 実績報告書

凸最適化の手法を用いたオンライン意思決定に関する研究

研究代表者

瀧本 英二 九州大学, システム情報科学研究科(研究院, 教授 (50236395)

現在までの達成度 (区分)

理由

研究成果

[雑誌論文] Efficient Sampling Method for Monte Carlo Tree Search2014

著者名/発表者名

雑誌名

DOI

[雑誌論文] SVMによる2 部ランキング学習を用いたコンピュータ将棋における評価関数の学習2014

著者名/発表者名

雑誌名

[雑誌論文] Efficient Algorithms for Combinatorial Online Prediction2013

著者名/発表者名

雑誌名

DOI

[雑誌論文] Combinatorial Online Prediction via Metarounding2013

著者名/発表者名

雑誌名

DOI

[学会発表] Combinatorial Online Prediction Using Online Approximation Algorithms

著者名/発表者名

学会等名

発表場所

[学会発表] Combinatorial Online Prediction via Metarounding

著者名/発表者名

学会等名

発表場所

[学会発表] Burgダイバージェンスを用いた行列のオンライン予測

著者名/発表者名

学会等名

発表場所

[学会発表] Combinatorial Online Prediction by Continuous Relaxation

著者名/発表者名

学会等名

発表場所

[学会発表] Efficient Algorithms for Combinatorial Online Prediction

著者名/発表者名

学会等名

発表場所

[学会発表] Burgダイバージェンスを用いた行列のオンライン予測

著者名/発表者名

学会等名

発表場所

[学会発表] BTモデルのオンライン推定に対するリグレット解析

著者名/発表者名

学会等名

発表場所

[学会発表] Lower Bounds for Linear Decision Trees via An Energy Complexity Argument

著者名/発表者名

学会等名

発表場所

[学会発表] Online Prediction with Bradley-Terry Models and Logistic Models

著者名/発表者名

学会等名

発表場所

[学会発表] Online Matrix Prediction with Log- Determinant Regularizer

著者名/発表者名

学会等名

発表場所

[学会発表] オンライン予測理論とその応用

著者名/発表者名

学会等名

発表場所

[学会発表] オンライン離散最適化

著者名/発表者名

学会等名

発表場所

[学会発表] 離散構造のオンライン予測

著者名/発表者名

学会等名

発表場所

[学会発表] Combinatorial Online Prediction via Metarounding

著者名/発表者名

学会等名

発表場所

[図書] 数学セミナー2013年12月号，特集「P≠NP予想最前線」2013

著者名/発表者名

2013 年度実績報告書

瀧本英二九州大学, システム情報科学研究科(研究院, 教授 (50236395)