研究課題/領域番号 |
26540190
|
研究機関 | 京都大学 |
研究代表者 |
森 信介 京都大学, 学術情報メディアセンター, 准教授 (90456773)
|
研究分担者 |
鶴岡 慶雅 東京大学, 工学(系)研究科(研究院), 准教授 (50566362)
|
研究期間 (年度) |
2014-04-01 – 2017-03-31
|
キーワード | ゲーム / 解説 / 文生成 |
研究実績の概要 |
将棋の局面とそれに対応するコメントを収集し、コーパスを作成した。 また、将棋に対して分野特有の固有表現を定義し、コーパスの一部、単語分割を行った2,508文に対して人手で固有表現をアノテーションした。 さらに、そのデータとBCCWJを使って学習したKyTeaとPWNERによって固有表現タグをコーパスの残り、742,286文に付与した。 これらのコーパスを用いてニューラルネットワークによる局面と特徴語の自動対応、および言語モデルによる自動解説システムを構築した。局面に対する感想を述べられるようになった。 また、盤面を参照することで固有表現の認識精度を向上させる方法を提案し、実験的に効果を確認した。 以上の成果は以下のサイトで公開している。 ゲーム解説コーパス: http://plata.ar.media.kyoto-u.ac.jp/data/game/home.html
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
データの収集と整備が概ね終了し、あとは量が十分かを確かめることである。 作成したデータを用いて自動解説システムのプロトタイプを構築し、局面に対する感想を述べられるようになった。 本来の課題に加えて、将棋の局面を参照すること(シンボルグラウンディング)による自動単語分割の精度向上や固有表現認識の精度向上の手法を考案し、トップの国際学会での発表に採択された(固有表現認識の発表は2016年度)。 以上から主たる目標はおおむね順調に進捗しており、また付帯的な研究成果も上がっているといえる。
|
今後の研究の推進方策 |
自動解説においては、先読み(未来予測)を含めた解説生成に取り組む必要がある。また、展開予想とその理由など2文以上を生成し、それらを適切な接続詞などで論理的に結合するようにしたい。 国際会議に採択された自動単語分割の精度向上や固有表現認識の精度向上については、説明やデータを豊富にした上で、論文誌への投稿を行う。 最後に、成果を用いてデモシステムを作成する。これは、今年度購入した置駒に機能を埋め込むことで実現される。
|
次年度使用額が生じた理由 |
残額が大きくなかったので調整しなかった。
|
次年度使用額の使用計画 |
少し多めに執行する。
|