研究課題/領域番号 |
19K20341
|
研究機関 | 京都大学 |
研究代表者 |
亀甲 博貴 京都大学, 学術情報メディアセンター, 助教 (50827524)
|
研究期間 (年度) |
2019-04-01 – 2023-03-31
|
キーワード | 音声認識 / コーパス / 対話 / ゲーム解説 / 自然言語処理 / ゲームAI |
研究実績の概要 |
本研究課題は音声対話をベースとした将棋の感想戦支援システムの構築を目的としたものである. 本年度はその中で,第一に音声対話の実現のための音声認識システムの分野適応に取り組んだ.本研究課題が対象とする将棋解説に関連する音声コーパスは整備されておらず収集も困難である一方で,将棋解説に関連するテキストコーパスは整備済みであるため,対象ドメインのテキストデータのみから言語モデルの分野適応を行うことによる音声認識精度向上への寄与を調査した.音声認識ツールとしてオープンソースのソフトウェアであるKaldiを採用した.Kaldiは音声認識の各モジュールがパイプライン形式で結合されているツールであり,End-to-Endのツールと比較して,その一部のモジュールを切り離して学習をすることが容易であると考えられる.Kaldiの言語モデルを将棋テキストコーパスを用いて学習することによって,将棋ドメインの音声を用いることなく将棋ドメインの音声の音声認識精度が向上することを確認した. 第二に将棋の熟練者によるアノテーションを行うことでコーパスの拡充を行った.アノテーションは固有表現の時系列の対応付けと盤面上の判断根拠の提示の2点からなる.これらは解説提示において重要な要素であり,これらの提示によってユーザの理解をより容易にすることが期待できる.本成果は言語資源を扱う国際会議である12th edition of the Language Resources and Evaluation Conferenceにおいて発表予定である.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究課題の遂行のための基礎部分である音声認識システムの構築を行った.
|
今後の研究の推進方策 |
対話ベースの解説提示システムの構築と,このシステムのベースとなる解説生成システムの構築を進めていく.特に後者は将棋解説に限らない汎用的な文生成手法の構築を目指し,構造を持った文の理解を含んだ文生成手法の構築を目指す.
|
次年度使用額が生じた理由 |
今般の新型肺炎の影響で予定されていた出張が取りやめになったり,物流の遅れなどから使用額が予定より少なくなった.次年度はこれらを合わせ,研究遂行の加速のために機材の購入を進めていく.
|