• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2022 年度 実施状況報告書

ニューラル機械翻訳のためのコンテキストアウェアな潜在変数モデルの研究

研究課題

研究課題/領域番号 21K12031
研究機関愛媛大学

研究代表者

二宮 崇  愛媛大学, 理工学研究科(工学系), 教授 (20444094)

研究期間 (年度) 2021-04-01 – 2024-03-31
キーワード機械翻訳 / 深層ベイズ学習 / トランスフォーマー / 潜在変数モデル
研究実績の概要

令和4年度は、潜在変数を用いたコンテキストアウェアな機械翻訳の学習を目的として、1) 潜在ディリクレ配分法 (LDA) を用いたトランスフォーマーの研究、2) EMアルゴリズムを用いたバイリンガルサブワード分割の研究、3) 潜在拡散モデルを用いたマルチモーダル機械翻訳の研究、4) 階層型BARTによる生成型要約の研究を行った。
1)について、潜在変数トピックモデルの有効性を確認するために、LDAにより与えられるタグを対訳文の先頭に付与して機械翻訳を行う手法を提案した。日英対訳コーパスASPECを用いた実験の結果、提案手法により翻訳精度BLEUが38.8%から39.0%まで向上することを確認できた。
2)について、現在ほとんどの機械翻訳システムではトークン分割のためにサブワード分割が用いられているが、従来のサブワード分割は単言語を対象としていた。本研究では、ユニグラム言語モデルを基にして、2言語間のサブワードアライメントを潜在変数とするバイリンガルサブワード分割を提案した。サブワードの対応関係を学習するためにEMアルゴリズムを用いた。ASPECを用いた実験の結果、日英翻訳のBLEU値が26.7%から27.3%まで向上することが確認できた。
3)について、潜在拡散モデルを用いることで、マルチモーダル機械翻訳に不要な画像情報を除去する画像変換を行う手法を提案した。Multi30kを用いた実験の結果、BLEU値が41.06%から41.20%まで向上することが確認できた。
4)について、階層型モデルの有効性を確認するため、コンテキストアウェアな階層型BARTによる生成型要約の研究を行った。文レベルの情報と単語レベルの情報を階層的に融合するモデルを考案し、自動要約に適用した。実験の結果、要約精度ROUGEが40.88%から40.98%まで向上することが確認できた。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

研究目的と研究実施計画に従って予定通り研究を進めることが出来た。潜在変数モデルによるトピックの有効性や、文脈をモデルに組み込むことの有効性を機械翻訳および自動要約の実験により確認できた。

今後の研究の推進方策

潜在変数モデルをT-CVAEに組み込むことで、状況・文脈を考慮した潜在変数を扱う機械翻訳モデルの研究を行う。文レベルの潜在変数を扱うT-CVAEモデルの考案および開発を行い、文章として連続している対訳コーパスを用いて実験を行う。

次年度使用額が生じた理由

実験で用いるGPUを購入する予定であったが、想定よりも大規模な実験を行う必要があることが判明したため、次年度の助成金と合わせてより性能の高いGPUを購入する。

  • 研究成果

    (3件)

すべて 2023 2022

すべて 雑誌論文 (1件) (うち査読あり 1件、 オープンアクセス 1件) 学会発表 (2件)

  • [雑誌論文] Hie-BART:階層型BARTによる生成型要約2022

    • 著者名/発表者名
      秋山 和輝, 田村 晃裕, 二宮 崇, 梶原 智之
    • 雑誌名

      自然言語処理

      巻: 29 ページ: 835-853

    • DOI

      10.5715/jnlp.29.835

    • 査読あり / オープンアクセス
  • [学会発表] バイリンガルサブワード分割のためのEMアルゴリズム2023

    • 著者名/発表者名
      松井 大樹, 二宮 崇, 田村 晃裕
    • 学会等名
      言語処理学会 第29回年次大会
  • [学会発表] 潜在拡散モデルによる変換画像を用いるマルチモーダルニューラル機械翻訳2023

    • 著者名/発表者名
      湯浅 亮也, 田村 晃裕, 梶原 智之, 二宮 崇, 加藤 恒夫
    • 学会等名
      言語処理学会 第29回年次大会

URL: 

公開日: 2023-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi