本研究は将棋の感想戦支援システムの構築を目的としたものである. これまでの研究で,音声認識モジュールとしてKaldiを用いていたが,新たにWhisperと呼ばれる音声認識モデルが提案・公開されたため,これの将棋解説文に対しての性能の調査を行った.また,最近の事前学習済みモデルを活用した研究の知見を活用し,各モジュールの性能改善を試みた.具体的には,事前学習済みのTransformerベースの言語モデルを初期値として将棋解説文生成のための言語モデルを構築することで,より自然な自然言語の生成が可能となる. また,これらを組み合わせてシステム全体を構築し,これの性能についての報告を準備している. また,ChatGPTに代表される学習済みの大規模言語モデルを対象に,将棋解説文への活用が可能かどうかの調査を行った.具体的には,言語モデルが将棋のルールを把握しているか・fine tuningなしに将棋をプレイできるかなどを調査した.結論としてはfine tuningをしていない大規模言語モデルが将棋を正しく扱えているとは言えないと判断し,そのままの状態で提案システムへの活用は難しいという結論に至った.しかしながら事前学習済みモデルを特定タスクに対してfine tuningする技術や,大規模言語モデル外の知識にアクセスすることを可能にする手法などが提案されていることから,これらを将棋解説文生成へ活用する可能性は十分あると考えられるため,引き続き調査を継続する.
|