研究概要 |
本年度は,過去の対局データをそこに出現する局面により検索するためのシステムを構築した.データベースの検索に関する研究は,従来から盛んに行われているが,本研究では2つの検索手法について検討を行なった. 1つ目の手法は,文字列パターン照合による検索である.この手法は,データベースとしてテキストファイルだけを保持しておけばよく,テキストエディタなどで簡単に追加や編集を行うことができるという利点がある.ただし,1棋譜当たり120局面生成される局面データを単純なテキストで表現すると,局面データベースが極めて大きなものになり,その分検索コストが増加するという欠点もある.そこで我々は,高速な複数文字列パターン照合機能を有するテキストデータベース管理システムSIGMAを用いた検索実験を行ない,テキストファイルによる局面データベース構築の可能性について検討を行なった.SIGMAでは,テキストファイルを1回走査するだけで複数のパターンの出現を検出することができる.さらに複数のキーワードからなる論理式を質問として与えることでより柔軟な検索を行うことができる. 2つ目の手法は,転置ファイル法と呼ばれる手法である.検索が非常に速いことで知られており,大規模データベースにおける検索手法としてよく用いられているが,一般に,データベースの維持管理に対する手間と時間のコストが高いという難点がある.また,局面による棋譜検索では,駒を索引とした局面データの検索と局面を索引とした棋譜データの検索という2段階の検索が必要となるため,転置ファイルの管理はより繁雑になる. 上に示した2つの手法の比較を行うために,1500対局,約17万局面分のデータベースを作成し検索速度の計測を行なった結果,盤上に40駒すべてを配置した局面検索を行った場合の検索時間は,SIGMAの場合で3.79秒,転置ファイルを用いた場合は0.16秒であった.また,盤上に一部の駒だけ配置した部分一致による局面検索においても,SIGMAによる検索時間は転置ファイルを用いた場合の検索時間の概ね数十倍程度のものであった.データベース管理の容易さと検索の柔軟さを考慮すれば,文字列パターン照合による検索が局面検索において十分有効であることが確認できた.
|