本研究においては、囲碁プログラムを主な題材として、その思考アルゴリズムにおいて、人間の思考における「直観」に相当する機能をニューラルネットワークのパターン認識機能等により実現することを目指している。 昨年度までに、これまで9×9の小さなサイズの詰碁課題に対して適用してきたニューラルネットワークシステムを正規の囲碁のサイズである19×19の大きさの課題に対して適用可能となるよう拡張を行なったが、今年度は、ニューラルネットワークの学習を詰碁だけでなく囲碁一般に適用できるようにシステムの拡張を行ない、実験を行なった。その結果、囲碁一般のパターンに対しても、ニューラルネットワークがある程度のパターン認識能力を獲得可能であることがわかった。その一方で、実際の囲碁プログラムに適用するために、さらなるパターン認識能力の向上が必要であると考えられる。 現在、空間的パターンだけでなく、手順のような時間的パターンも含めて学習を行なう計算機実験の準備を行なっている。さらに探索などの従来のゲームプログラミングの手法と組み合わせた形の思考アルゴリズムでシステムを構築する予定である。 また、パターン学習の手法として、ニューラルネットワーク以外にも強化学習の手法の1つであるTemporal Difference学習法も利用する実験を行なった。囲碁プログラムとは直接関わりはないが、古代の将棋の駒価値などの学習を自動的に行なう実験においてTemporal Difference学習法を採用して成果を上げた。これは、本研究の囲碁システムにおいてTemporal Difference学習法を適用するための予備実験として位置づけることができ、現在、囲碁システムにおいてTemporal Difference学習法を適用する実験を継続中である。
|