未知環境中で動作するオートマトンの学習に関する研究は、1960年代の初頭にソ連(当時)のTsetlinによって開始された。彼は、決定性オートマトンの学習について興味深い研究を発表したが、しばらくして、同じソ連の研究者であるVarshavskiiとVorontsovaが確率オートマトンの学習に関する研究をスタートさせた。その後、数多くの研究者がこの分野に参入することとなり、理論面での整備と共に、様々な応用に関する興味深い研究が次々と展開されてきた。そして、現在では、Oommenらによって提案されたDGPAアルゴリズムとPapadimitriouらによって提案されたSE_<R1>アルゴリズムが最も優れた学習的性能を有する学習アルゴリズムとして一般に認識されている。 本研究では、非定常複数教師環境中で動作する階層構造確率オートマトンの学習について考察した。そして、最近に得られた情報を活用する学習アルゴリズムを提案し、ある条件の下で最適パスへ収束することを証明した。更に、DGPAアルゴリズムとSE_<R1>アルゴリズムを階層構造学習アルゴリズムとして使用可能な形に拡張し、幾つかの具体的な非定常複数教師環境において、本研究で提案した学習アルゴリズムとの計算機シミュレーションによる学習的性能に関する比較を行った。そして、数多くの例において、我々の学習アルゴリズムがこれまでに提案された2つの代表的なアルゴリズムより学習的性能において優れた結果を示すことを確認した。
|