研究課題/領域番号 |
26540190
|
研究機関 | 京都大学 |
研究代表者 |
森 信介 京都大学, 学術情報メディアセンター, 准教授 (90456773)
|
研究分担者 |
鶴岡 慶雅 東京大学, 工学研究科, 准教授 (50566362)
|
研究期間 (年度) |
2014-04-01 – 2017-03-31
|
キーワード | ゲーム / 解説 / 文生成 |
研究実績の概要 |
将棋の解説文の生成には、将棋の解説文に対していくつかの言語処理がある程度の精度で行えることが前提となる。まず、必ず必要となる単語分割について正解データを作成して精度を測定した。結果、91%程度と低かったので、辞書の充実や学習データの追加を行い、97%程度まで高めることに成功した。これは、形態素解析器 KyTea の配布モデルとして公開している。また、23種類の将棋用語を定義し、これらを自動認識するシステムを作成した。 次に、これらの言語処理を用いて単語に分割された解説文の単語と、局面のとの対応を自動的に取ることで、新たな局面に対してそれを表す特徴語を出力するモジュールを作成した。 最後に、自動で単語に分割された大量の解説文から単語単位の確率的言語モデルを構築し、特徴語を入力として文を生成するモジュールを構築した。この結果、与えられた局面に対する文を生成することができるようになった。生成された文を精査した結果、精度は不十分であることがわかり、問題となる個所の改善について考案した。 以上の成果は以下のサイトで公開している。 KyTea 配布モデル: http://www.phontron.com/kytea/index-ja.html
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
基本的な言語処理ツールを適応・構築し、将棋の解説文に対していくつかの言語処理がある程度の精度で行えるようになった。 新たな局面に対してそれを表す特徴語を出力するモジュールが作成できた。 特徴語を入力として文を生成するモジュールが構築できた。 この結果、予定通り、一通りの動作を行うシステムが完成し、誤りの分析とその結果に基づく各部分の精度向上に取り組むことが可能となった。
|
今後の研究の推進方策 |
完成したシステムの出力の誤りの分析を行い、その結果に基づいて各部分の精度向上に取り組む。 また、深層学習などのより複雑なモデルで局面の認識や文生成を試みる
|
次年度使用額が生じた理由 |
用語の自動認識を使うか否かの方針が未確定のため、そのアノテーションを保留したため。
|
次年度使用額の使用計画 |
早い段階で方針を確定し、係り受けか用語のアノテーションかのいずれかを行う。
|