2015 Fiscal Year Research-status Report
解説するコンピュータ将棋:データ分析と未来予測の言語化
Project/Area Number |
26540190
|
Research Institution | Kyoto University |
Principal Investigator |
森 信介 京都大学, 学術情報メディアセンター, 准教授 (90456773)
|
Co-Investigator(Kenkyū-buntansha) |
鶴岡 慶雅 東京大学, 工学(系)研究科(研究院), 准教授 (50566362)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | ゲーム / 解説 / 文生成 |
Outline of Annual Research Achievements |
将棋の局面とそれに対応するコメントを収集し、コーパスを作成した。 また、将棋に対して分野特有の固有表現を定義し、コーパスの一部、単語分割を行った2,508文に対して人手で固有表現をアノテーションした。 さらに、そのデータとBCCWJを使って学習したKyTeaとPWNERによって固有表現タグをコーパスの残り、742,286文に付与した。 これらのコーパスを用いてニューラルネットワークによる局面と特徴語の自動対応、および言語モデルによる自動解説システムを構築した。局面に対する感想を述べられるようになった。 また、盤面を参照することで固有表現の認識精度を向上させる方法を提案し、実験的に効果を確認した。 以上の成果は以下のサイトで公開している。 ゲーム解説コーパス: http://plata.ar.media.kyoto-u.ac.jp/data/game/home.html
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
データの収集と整備が概ね終了し、あとは量が十分かを確かめることである。 作成したデータを用いて自動解説システムのプロトタイプを構築し、局面に対する感想を述べられるようになった。 本来の課題に加えて、将棋の局面を参照すること(シンボルグラウンディング)による自動単語分割の精度向上や固有表現認識の精度向上の手法を考案し、トップの国際学会での発表に採択された(固有表現認識の発表は2016年度)。 以上から主たる目標はおおむね順調に進捗しており、また付帯的な研究成果も上がっているといえる。
|
Strategy for Future Research Activity |
自動解説においては、先読み(未来予測)を含めた解説生成に取り組む必要がある。また、展開予想とその理由など2文以上を生成し、それらを適切な接続詞などで論理的に結合するようにしたい。 国際会議に採択された自動単語分割の精度向上や固有表現認識の精度向上については、説明やデータを豊富にした上で、論文誌への投稿を行う。 最後に、成果を用いてデモシステムを作成する。これは、今年度購入した置駒に機能を埋め込むことで実現される。
|
Causes of Carryover |
残額が大きくなかったので調整しなかった。
|
Expenditure Plan for Carryover Budget |
少し多めに執行する。
|