研究概要 |
本研究では,いろいろな分野において重要な状況評価関数の自動獲得と動的評価器の自動生成とを目的とし,以下の要素からなる. (1)評価関数を構成するために、featureと呼ばれる局面判断のための部分データの集合を、局面遷移規則と評価用のデータのみから人間の介入なしに創出する。 (2)feature集合で有効に働くものの中に含まれる部分述語の集合から部分集合の束であるガロア束を構成し、その局面判断に対して有効な概念を抽出しデータベース化する。 (3)局面判断を行なうエージェントを自己反映計算の手法をもちいて作成し,上記の内容にもとずいて最適な判断を動的に採り入れて効率良く評価を行なうシステムを実現する。 今年度は本研究の中核であるfeature集合の自動生成に力点をおき,例題ドメインとして二人ゲームであるオセロと挟み将棋,それに詰将棋を取り上げ,大規模な実験と分析とを行なった.その結果,評価関数の自動生成のためには (1)featureを局面に適用して値を求めるための計算効率の高さ 2)適度に要素的な大量のfeatureの生成 の2項目が本質的に重要であることを解明するとともに,実際の評価処理系として通常の処理系と比べ10万倍以上の効率をもつものを構築することに成功した.その結果,現在知られている最強のオセロプログラムが使用している評価関数に迫る性能の評価関数をゲームのルールだけから自動的に生成することができた.
|