研究課題/領域番号 |
21K12031
|
研究機関 | 愛媛大学 |
研究代表者 |
二宮 崇 愛媛大学, 理工学研究科(工学系), 教授 (20444094)
|
研究期間 (年度) |
2021-04-01 – 2025-03-31
|
キーワード | 機械翻訳 / 深層ベイズ学習 / トランスフォーマー / 潜在変数モデル |
研究実績の概要 |
令和5年度は、潜在変数を用いたコンテキストアウェアな機械翻訳の学習を目的として、1) 潜在拡散モデルを用いたマルチモーダル機械翻訳の研究、2) T-CVAEに基づく機械翻訳の研究を行った。 1)について、潜在拡散モデルを用いることで、マルチモーダル機械翻訳に不要な画像情報を除去する画像変換を行う手法を提案した。Multi30kを用いた実験の結果、BLEU値が41.06%から41.20%まで向上することが確認できた。この研究成果は the 61st Annual Meeting of the Association for Computational Linguistics Student Research Workshopにおいて発表した。 2)について、変分推論を用いたトランスフォーマーのための潜在変数モデル(T-CVAE)の開発と実験を行った。T-CVAEはトランスフォーマーに基づく変分オートエンコーダ(VAE)を条件付きモデルに拡張した系列変換モデル(Wang & Wan, 2019)であり、本研究ではこのモデルを実装し、機械翻訳に応用することを行った。T-CVAEでは、変分推論に基づき、機械翻訳の負対数尤度に加えて、潜在変数の事前分布と事後分布のKLダイバージェンスを最小化することで、潜在変数付き系列変換モデルの学習が行われる。潜在変数により多様な表現の機械翻訳が実現されることが期待される。日英対訳コーパスASPECを用いて英日機械翻訳の実験を行ったところ、トランスフォーマーと比べて翻訳精度は同程度であったものの、多様性評価では非常に高い多様性が得られることが確認できた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
研究目的と研究実施計画に従って予定通り研究を進めることが出来た。潜在変数モデルにより、機械翻訳出力に対し高い多様性が得られることが確認できた。ただし、標準的に用いられる規模の対訳データに対する提案手法の精緻な評価ができていない。
|
今後の研究の推進方策 |
標準的に用いられる規模の対訳データに対して評価ができていないため、来年度はこれらの実験を行い、提案手法の精緻な評価を行う。また、今までの研究成果をまとめ、国際会議またはジャーナルに論文を投稿する。
|
次年度使用額が生じた理由 |
来年度は、補助事業の目的をより精緻に達成するための追加実験を行い、今までの研究成果をまとめて発表することを行う。その実験のためのGPUとPCが必要であり、成果発表のための論文投稿費と旅費が必要となる。
|