本研究においては囲碁プログラムを題材として人間の思考における「直観」に相当する機能を実現することを目指している。本研究の初年度となる今年度の目標はニューラルネットワークによる詰碁に関するパターン認識能力の向上、及び、次年度において詰碁だけでなく、碁のパターンへ応用を拡張するための様々な手法に関する予備評価、の2点である。 まず、さまざまな大きさの詰碁問題に対する解答能力の評価を行なった。その結果、ニューラルネットワークによる解答能力は詰碁問題のサイズが大きくなるにつれて徐々に解答能力が低下していくことがわかった。そのため、19×19の正規サイズの大きな盤面における詰碁課題に対しても、十分な解答能力を保持したニューラルネットワークを構築する手法を検討した。 ニューラルネットワークの構造、学習方法の最適化のために異なるネットワークにおける計算機実験を行ない、現在、データの解析中である。 次年度に計画しているトータルな囲碁システムの作成に利用可能な手法の調査、評価も行なった。 パターン学習の手法として、典型的な逆誤差伝播法による学習を行なうニューラルネットワークを利用する以外の方法として、強化学習の手法の1つであるTemporal Difference学習法に着目して評価を行なった。Temporal Difference学習法に関して、本研究で対象としている囲碁および詰碁とは直接の関わりはないが、申請者が並行して行なっている研究において、古代の将棋の駒価値などの学習を自動的に行なう手法としてこの学習法を採用し、成果を上げた。これは本研究の予備実験としても位置付けることが可能で、次年度の研究では、これまでの方法に加えて、Temporal Difference学習法を利用した知的システムの構築も検討する。
|