• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2023 年度 実績報告書

自然言語の構成性に着目した機械翻訳の研究

研究課題

研究課題/領域番号 21H03500
配分区分補助金
研究機関奈良先端科学技術大学院大学

研究代表者

須藤 克仁  奈良先端科学技術大学院大学, 先端科学技術研究科, 准教授 (00396152)

研究分担者 中村 哲  奈良先端科学技術大学院大学, 先端科学技術研究科, 教授 (30263429)
研究期間 (年度) 2021-04-01 – 2025-03-31
キーワード機械翻訳 / 長文翻訳 / 文脈を考慮した翻訳 / 順送り訳
研究実績の概要

2023年度は研究項目1と研究項目2を一部統合する形での取り組みを行った。
1) 分割統治型翻訳においては節分割により文内文脈情報が失われるという問題に対処するため、文内文脈情報を明示的に与えた形で翻訳モデルの学習を行うことにより、分割を要する複雑な構造の文に対する翻訳の自動評価値が向上することを示した。
2) 音声翻訳のための音声セグメント分割手法について、追加検証・分析を行い海外雑誌論文に採録された他、より短い時間幅で漸進的に音声分割を行う形のストリーミング同時音声翻訳手法を提案し、既存手法を上回る性能が得られることを示した。
3) 漸進的機械翻訳のための評価手法である Average Token Delay を提案し、昨年度提案した Prefix Alignment 法による漸進的機械翻訳の効果検証がより正確に行えるようになった。関連成果が国際会議論文1件採択、国内雑誌論文1件採録。
4) 細かい単位で入力分割を行う漸進的機械翻訳の研究用データとして、文内文脈を考慮しつつ適切な補足を加えた訳出を行う、500文規模の人手による順送り訳データの作成を行った。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

分割統治型翻訳については適用範囲が限られてはいるものの、適用範囲内で効果が得られることが分かり、また文内文脈情報の効果も明らかになったことから本研究計画の問いについて一定の前向きな結果が得られたと言える。
また、音声翻訳における入力発話分割やそれを推し進めた漸進的機械翻訳についても効率面・精度面での向上が達成でき、有効性を示すことができた。
データ整備については、当初計画の階層的な構造という形ではなく、漸進的な翻訳という方針に切り替え、少量だが高品質な順送り訳データを作成することができた。

今後の研究の推進方策

最終年度はこれまでの成果のさらなる検証と雑誌論文化を行うとともに、作成した順送り訳データの活用をすすめ、本研究計画のまとめとなる機械翻訳・音声翻訳技術を確立する。

  • 研究成果

    (6件)

すべて 2024 2023

すべて 雑誌論文 (2件) (うち査読あり 2件、 オープンアクセス 1件) 学会発表 (4件) (うち国際学会 1件)

  • [雑誌論文] Improving Speech Translation Accuracy and Time Efficiency With Fine-Tuned wav2vec 2.0-Based Speech Segmentation2024

    • 著者名/発表者名
      Fukuda Ryo、Sudoh Katsuhito、Nakamura Satoshi
    • 雑誌名

      IEEE/ACM Transactions on Audio, Speech, and Language Processing

      巻: 32 ページ: 906~916

    • DOI

      10.1109/TASLP.2023.3343614

    • 査読あり
  • [雑誌論文] Prefix Alignment for Training Simultaneous Machine Translation2024

    • 著者名/発表者名
      Kano Yasumasa、Sudoh Katsuhito、Nakamura Satoshi
    • 雑誌名

      Journal of Natural Language Processing

      巻: 31 ページ: 79~104

    • DOI

      10.5715/jnlp.31.79

    • 査読あり / オープンアクセス
  • [学会発表] 漸進的な音声分割を用いたストリーミング同時音声翻訳2024

    • 著者名/発表者名
      福田りょう, 須藤克仁, 中村哲
    • 学会等名
      言語処理学会 第30回年次大会
  • [学会発表] 文内コンテキストを利用した分割統治ニューラル機械翻訳2024

    • 著者名/発表者名
      石川隆太, 加納保昌, 須藤克仁, 中村哲
    • 学会等名
      言語処理学会 第30回年次大会
  • [学会発表] Average Token Delay: A Latency Metric for Simultaneous Translation2023

    • 著者名/発表者名
      Yasumasa Kano, Katsuhito Sudoh, Satoshi Nakamura
    • 学会等名
      Interspeech 2023
    • 国際学会
  • [学会発表] Average Token Delay: 同時通訳の遅延評価尺度2023

    • 著者名/発表者名
      加納保昌, 須藤克仁, 中村哲
    • 学会等名
      日本通訳翻訳学会第24回年次大会

URL: 

公開日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi