2013 Fiscal Year Research-status Report
Project/Area Number |
25330261
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Research Institution | Kyushu University |
Principal Investigator |
畑埜 晃平 九州大学, システム情報科学研究科(研究院, 助教 (60404026)
|
Project Period (FY) |
2013-04-01 – 2016-03-31
|
Keywords | オンライン予測 / 機械学習 / 離散最適化 / ブースティング / 近似アルゴリズム |
Research Abstract |
離散構造のオンライン予測問題は,ルーティングやランキング,スケジューリングなど多くの分野に現れる.離散構造の例としてはs-t パス,集合被覆,順列などが挙げられる.オンライン離散最適化問題においては,離散構造のクラスが前もって与えられた上で,プレイヤーと敵対者間で,(1)プレイヤーが離散構造クラスから離散構造を1つ予測し,(2)敵対者が選ばれた離散構造に対して,損失を与える,という一連のやりとりを繰り返し行う.プレイヤーのゴールは「後から見て最適な固定の離散構造」にほぼ匹敵する予測を行う事である. オンライン離散最適化に対するより汎用的なアプローチは,対応するオフライン離散最適化アルゴリズムをオンライン予測手法に「変換」する事である.これを「オフライン-オンライン変換」と呼ぶ.より正確には,我々は離散構造クラスに対するオフライン近似アルゴリズムを仮定する.プレイヤーはオフラインアルゴリズムをサブルーチンとして用いてよい. 本研究では,オフライン近似アルゴリズムにが,連続緩和に基づくという自然な仮定の下で,効率的なオフライン-オンライン変換手法を開発した.特に,本研究では,従来近似アルゴリズムの分野で知られていたメタラウンディングという概念が,離散構造のオンライン予測に有用である事を見出し,見通しの良いアルゴリズム設計が可能となった.また,機械学習におけるブースティング手法(複数の予測ルールを統合することによってより予測精度の高い予測ルールを構築する手法)とメタラウンディングの共通性を利用し,ブースティングに基づく効率的なメタラウンディング手法を構築した. その他の研究として,モンテカルロ法に基づくゲーム木の探索手法,ランキング学習の将棋への応用,行列や順序に関するオンライン予測手法の研究を行った.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
申請者らは,オフライン最適化アルゴリズムが連続緩和に基づくという,自然な仮定の下で,従来手法よりも遥かに効率的なオフライン-オンライン変換手法を構築した.この結果は本研究が掲げる離散構造のオンライン予測基盤技術における主要な成果の1つと言える.
|
Strategy for Future Research Activity |
本研究の掲げる離散構造のオンライン予測基盤技術の確立のため,今後以下の研究を進めていく. (1)連続緩和を仮定しないオフライン-オンライン変換手法の効率化. (2)順列など順序を表現する離散構造に対するオンライン予測手法の深化. (3)それらの応用.
|
Expenditure Plans for the Next FY Research Funding |
関連プロジェクトの寄付金により本研究の支出の一部をまかなったため,また,共同研究の渡航旅費を滞在先の研究資金により援助されたため,当初予定していた物品費・旅費が未使用となったためである. 本研究を遂行するためのサーバ・ソフトウェア,プログラム作成支援のための大学院生の謝金,成果発表・資料収集のための旅費として使用予定である.
|