研究概要 |
従来のデータ学習法は, データが生成される環境が定常的(すなわち時間とともに変化しない)という大前提の下で理論が構築され, その理論に基づいたアルゴリズムが開発されてきた. しかしながら, 近年の応用分野では定常性が成り立たない場合が多い. 本研究プロジェクトの目的は, 環境の変化に対応するための基礎理論, および, 実用的なアルゴリズム開発を行なうことである. 研究は, 動的な環境下でうまく学習を行なうための基礎理論を開発するところからはじめた. 具体的には, 統計学の分野でよく用いられている重点サンプリングと呼ばれる基礎理論を応用し, 環境が変化した場合でもアルゴリズムが正しい答えに収束することを理論的に保証するための基礎数理的な地盤固めを行った. また, 研究代表者がリーダーをつとめている機械学習研究グループT-PRIMAL(大学・研究所・企業などから様々な異なる背景を持つ気鋭の若手研究者を集めた研究グループ)のメンバーと情報交換を行い, 機会学習理論に関する多角的な情報収集を行った. また, ドイツMax-Planck研究所の研究員と, 非定常環境学習理論のロボット制御応用に関して蜜に情報交換を行い, 来年度以降行う予定の応用研究の準備を整えた.
|