ニューラル機械翻訳のためのコンテキストアウェアな潜在変数モデルの研究

研究課題

研究課題/領域番号	21K12031
研究種目	基盤研究(C)
配分区分	基金
応募区分	一般
審査区分	小区分61030:知能情報学関連
研究機関	愛媛大学
研究代表者	二宮崇愛媛大学, 理工学研究科(工学系), 教授 (20444094)
研究期間 (年度)	2021-04-01 – 2025-03-31
研究課題ステータス	交付 (2023年度)
配分額 *注記	4,160千円 (直接経費: 3,200千円、間接経費: 960千円) 2023年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円) 2022年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円) 2021年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
キーワード	機械翻訳 / 深層ベイズ学習 / トランスフォーマー / 潜在変数モデル / フローベースモデル
研究開始時の研究の概要	近年、複数文をまとめて入力することで文脈を考慮するニューラル機械翻訳の研究が盛んに行われているが、状況・文脈を表す抽象的な特徴を学習する機械翻訳技術が十分には確立されていないという問題がある。本研究は、これらの問題を解決するために、状況・文脈を表す潜在変数を有するフローベーストランスフォーマーモデルの研究を行う。フローベース深層生成モデルは可逆関数で表される確率的生成モデルであり、逆関数を用いることで潜在変数が直接得られることから、潜在変数の学習モデルとして期待されている。本研究は、変分推定を基礎として、フローベース深層生成モデルを文レベル潜在変数とする機械翻訳モデルの実現を目指す。
研究実績の概要	令和5年度は、潜在変数を用いたコンテキストアウェアな機械翻訳の学習を目的として、1) 潜在拡散モデルを用いたマルチモーダル機械翻訳の研究、2) T-CVAEに基づく機械翻訳の研究を行った。 1)について、潜在拡散モデルを用いることで、マルチモーダル機械翻訳に不要な画像情報を除去する画像変換を行う手法を提案した。Multi30kを用いた実験の結果、BLEU値が41.06%から41.20%まで向上することが確認できた。この研究成果は the 61st Annual Meeting of the Association for Computational Linguistics Student Research Workshopにおいて発表した。 2)について、変分推論を用いたトランスフォーマーのための潜在変数モデル(T-CVAE)の開発と実験を行った。T-CVAEはトランスフォーマーに基づく変分オートエンコーダ(VAE)を条件付きモデルに拡張した系列変換モデル(Wang & Wan, 2019)であり、本研究ではこのモデルを実装し、機械翻訳に応用することを行った。T-CVAEでは、変分推論に基づき、機械翻訳の負対数尤度に加えて、潜在変数の事前分布と事後分布のKLダイバージェンスを最小化することで、潜在変数付き系列変換モデルの学習が行われる。潜在変数により多様な表現の機械翻訳が実現されることが期待される。日英対訳コーパスASPECを用いて英日機械翻訳の実験を行ったところ、トランスフォーマーと比べて翻訳精度は同程度であったものの、多様性評価では非常に高い多様性が得られることが確認できた。
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由研究目的と研究実施計画に従って予定通り研究を進めることが出来た。潜在変数モデルにより、機械翻訳出力に対し高い多様性が得られることが確認できた。ただし、標準的に用いられる規模の対訳データに対する提案手法の精緻な評価ができていない。
今後の研究の推進方策	標準的に用いられる規模の対訳データに対して評価ができていないため、来年度はこれらの実験を行い、提案手法の精緻な評価を行う。また、今までの研究成果をまとめ、国際会議またはジャーナルに論文を投稿する。

報告書

(3件)

研究成果
(4件)

すべて 2023 2022

すべて雑誌論文 (2件) (うち査読あり 2件、オープンアクセス 2件) 学会発表 (2件)

[雑誌論文] Multimodal Neural Machine Translation Using Synthetic Images Transformed by Latent Diffusion Model2023
- 著者名/発表者名
  Yuasa Ryoya、Tamura Akihiro、Kajiwara Tomoyuki、Ninomiya Takashi、Kato Tsuneo
- 雑誌名
  
  Proceedings of the 61st Annual Meeting of the Association for Computational Linguistics (Volume 4: Student Research Workshop)
  
  巻: - ページ: 76-82
- DOI
  10.18653/v1/2023.acl-srw.12
- 関連する報告書
  2023 実施状況報告書
- 査読あり / オープンアクセス
[雑誌論文] Hie-BART: 階層型 BART による生成型要約2022
- 著者名/発表者名
  秋山和輝, 田村晃裕, 二宮崇, 梶原智之
- 雑誌名
  
  自然言語処理
  
  巻: 29 号: 3 ページ: 835-853
- DOI
  10.5715/jnlp.29.835
- ISSN
  1340-7619, 2185-8314
- 関連する報告書
  2022 実施状況報告書
- 査読あり / オープンアクセス
[学会発表] バイリンガルサブワード分割のためのEMアルゴリズム2023
- 著者名/発表者名
  松井大樹, 二宮崇, 田村晃裕
- 学会等名
  言語処理学会第29回年次大会
- 関連する報告書
  2022 実施状況報告書
[学会発表] 潜在拡散モデルによる変換画像を用いるマルチモーダルニューラル機械翻訳2023
- 著者名/発表者名
  湯浅亮也, 田村晃裕, 梶原智之, 二宮崇, 加藤恒夫
- 学会等名
  言語処理学会第29回年次大会
- 関連する報告書
  2022 実施状況報告書

ニューラル機械翻訳のためのコンテキストアウェアな潜在変数モデルの研究

研究代表者

二宮 崇 愛媛大学, 理工学研究科(工学系), 教授 (20444094)

4,160千円 (直接経費: 3,200千円、間接経費: 960千円)

現在までの達成度 (区分)

理由

報告書

研究成果

[雑誌論文] Multimodal Neural Machine Translation Using Synthetic Images Transformed by Latent Diffusion Model2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Hie-BART: 階層型 BART による生成型要約2022

著者名/発表者名

雑誌名

DOI

ISSN

関連する報告書

[学会発表] バイリンガルサブワード分割のためのEMアルゴリズム2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] 潜在拡散モデルによる変換画像を用いるマルチモーダルニューラル機械翻訳2023

著者名/発表者名

学会等名

関連する報告書

二宮崇愛媛大学, 理工学研究科(工学系), 教授 (20444094)