• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2022 年度 実績報告書

自然言語の構成性に着目した機械翻訳の研究

研究課題

研究課題/領域番号 21H03500
配分区分補助金
研究機関奈良先端科学技術大学院大学

研究代表者

須藤 克仁  奈良先端科学技術大学院大学, 先端科学技術研究科, 准教授 (00396152)

研究分担者 中村 哲  奈良先端科学技術大学院大学, データ駆動型サイエンス創造センター, 教授 (30263429)
研究期間 (年度) 2021-04-01 – 2025-03-31
キーワード機械翻訳 / 長文翻訳 / 順送り訳
研究実績の概要

2022年度も研究項目1について集中して取り組んだ。
1) 分割統治型翻訳のための多言語事前学習モデルmBARTに基づくアプローチについて基礎検討を行い、節の等位接続の前後で分割して下訳を作成し、下訳を接続詞で連結した混合文を再度機械翻訳の入力とする二段階の手法の検証を行った。本手法は過剰訳の抑制への効果が認められたが、自動評価における目立った向上には至らなかった。
2) 音声翻訳において入力音声を翻訳に適した単位に分割するために、オンライン実行可能な前向きアルゴリズムpTHRによる手法を考案し、人手での発話分割より短い単位での分割が可能な箇所を適応的に発見し音声翻訳の効率向上に寄与できることを示した。
3) 同時翻訳でも活用できる順送り訳を機械翻訳で実現するための学習手法として通常の翻訳モデルから順送り訳を生成可能なPrefix Alignment法を考案し、同時翻訳タスクで順送り制約の強い低遅延時の翻訳精度が向上できることを示した。
4) ボトムアップな構成性の活用検討のため、バイト単位の事前学習モデルである ByT5 を利用した自然言語処理タスクにおいてバイト単位トークンを明示的に結合するネットワーク構造を持つモデルの利用について検討し、処理効率が向上できることを示した。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

事前学習モデルを活用することで要素間の明示的対応を不要とする方式へ方針転換を行ったが検討が進んでいること、また音声翻訳での効率向上や順送り訳の強化等、新たな展開も見えてきていることから、当初計画を拡張する形で進展していると考えている。

今後の研究の推進方策

分割統治型翻訳については問題のより詳細な分析を進め2023年度中に一定の着地を目指すとともに、文章単位機械翻訳の発展に向けた方式検討に着手する。評価用データ作成については小規模ながらも研究期間中に一定の評価が可能なものの作成を目指す。

  • 研究成果

    (4件)

すべて 2023 2022

すべて 学会発表 (4件) (うち国際学会 2件)

  • [学会発表] 事前学習モデルによる分割統治ニューラル機械翻訳2023

    • 著者名/発表者名
      石川 隆太, 加納 保昌, 須藤 克仁, 中村 哲
    • 学会等名
      言語処理学会 第29回年次大会
  • [学会発表] ByT5 の Attention を用いたトークン結合2023

    • 著者名/発表者名
      田中康紀, 須藤克仁, 中村哲
    • 学会等名
      言語処理学会 第29回年次大会
  • [学会発表] Simultaneous Neural Machine Translation with Prefix Alignment2022

    • 著者名/発表者名
      Yasumasa Kano, Katsuhito Sudoh, Satoshi Nakamura
    • 学会等名
      The 19th International Conference on Spoken Language Translation (IWSLT 2022)
    • 国際学会
  • [学会発表] Speech Segmentation Optimization using Segmented Bilingual Speech Corpus for End-to-end Speech Translation2022

    • 著者名/発表者名
      Ryo Fukuda, Katsuhito Sudoh, Satoshi Nakamura
    • 学会等名
      The 23rd Interspeech Conference (Interspeech 2022)
    • 国際学会

URL: 

公開日: 2023-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi