• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Study on Machine Translation Focusing on the Compositionality of Natural Language

Research Project

Project/Area Number 23K21697
Project/Area Number (Other) 21H03500 (2021-2023)
Research Category

Grant-in-Aid for Scientific Research (B)

Allocation TypeMulti-year Fund (2024)
Single-year Grants (2021-2023)
Section一般
Review Section Basic Section 61030:Intelligent informatics-related
Research InstitutionNara Women's University (2024)
Nara Institute of Science and Technology (2021-2023)

Principal Investigator

須藤 克仁  奈良女子大学, 生活環境科学系, 教授 (00396152)

Co-Investigator(Kenkyū-buntansha) 中村 哲  奈良先端科学技術大学院大学, 先端科学技術研究科, 教授 (30263429)
Project Period (FY) 2021-04-01 – 2025-03-31
Project Status Granted (Fiscal Year 2024)
Budget Amount *help
¥17,290,000 (Direct Cost: ¥13,300,000、Indirect Cost: ¥3,990,000)
Fiscal Year 2024: ¥2,600,000 (Direct Cost: ¥2,000,000、Indirect Cost: ¥600,000)
Fiscal Year 2023: ¥4,290,000 (Direct Cost: ¥3,300,000、Indirect Cost: ¥990,000)
Fiscal Year 2022: ¥5,850,000 (Direct Cost: ¥4,500,000、Indirect Cost: ¥1,350,000)
Fiscal Year 2021: ¥4,550,000 (Direct Cost: ¥3,500,000、Indirect Cost: ¥1,050,000)
Keywords機械翻訳 / 構成性 / 長文翻訳 / 文脈を考慮した翻訳 / 順送り訳 / 文脈依存翻訳 / 自然言語処理 / 音声翻訳 / 分割統治 / 深層学習
Outline of Research at the Start

長く複雑な入力に対する頑健な機械翻訳の実現を目指し、(1)入力をより短く簡単な部分構造に分割して下訳を作成した後全体の訳を構成する分割統治的アプローチによる機械翻訳方式の実証と、(2)その際文脈情報を考慮することで必ずしも構成的でない自然言語の翻訳における頑健性向上を目指す。

Outline of Annual Research Achievements

2023年度は研究項目1と研究項目2を一部統合する形での取り組みを行った。
1) 分割統治型翻訳においては節分割により文内文脈情報が失われるという問題に対処するため、文内文脈情報を明示的に与えた形で翻訳モデルの学習を行うことにより、分割を要する複雑な構造の文に対する翻訳の自動評価値が向上することを示した。
2) 音声翻訳のための音声セグメント分割手法について、追加検証・分析を行い海外雑誌論文に採録された他、より短い時間幅で漸進的に音声分割を行う形のストリーミング同時音声翻訳手法を提案し、既存手法を上回る性能が得られることを示した。
3) 漸進的機械翻訳のための評価手法である Average Token Delay を提案し、昨年度提案した Prefix Alignment 法による漸進的機械翻訳の効果検証がより正確に行えるようになった。関連成果が国際会議論文1件採択、国内雑誌論文1件採録。
4) 細かい単位で入力分割を行う漸進的機械翻訳の研究用データとして、文内文脈を考慮しつつ適切な補足を加えた訳出を行う、500文規模の人手による順送り訳データの作成を行った。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

分割統治型翻訳については適用範囲が限られてはいるものの、適用範囲内で効果が得られることが分かり、また文内文脈情報の効果も明らかになったことから本研究計画の問いについて一定の前向きな結果が得られたと言える。
また、音声翻訳における入力発話分割やそれを推し進めた漸進的機械翻訳についても効率面・精度面での向上が達成でき、有効性を示すことができた。
データ整備については、当初計画の階層的な構造という形ではなく、漸進的な翻訳という方針に切り替え、少量だが高品質な順送り訳データを作成することができた。

Strategy for Future Research Activity

最終年度はこれまでの成果のさらなる検証と雑誌論文化を行うとともに、作成した順送り訳データの活用をすすめ、本研究計画のまとめとなる機械翻訳・音声翻訳技術を確立する。

Report

(3 results)
  • 2023 Annual Research Report
  • 2022 Annual Research Report
  • 2021 Annual Research Report
  • Research Products

    (13 results)

All 2024 2023 2022 2021

All Journal Article (2 results) (of which Peer Reviewed: 2 results,  Open Access: 1 results) Presentation (11 results) (of which Int'l Joint Research: 4 results)

  • [Journal Article] Improving Speech Translation Accuracy and Time Efficiency With Fine-Tuned wav2vec 2.0-Based Speech Segmentation2024

    • Author(s)
      Fukuda Ryo、Sudoh Katsuhito、Nakamura Satoshi
    • Journal Title

      IEEE/ACM Transactions on Audio, Speech, and Language Processing

      Volume: 32 Pages: 906-916

    • DOI

      10.1109/taslp.2023.3343614

    • Related Report
      2023 Annual Research Report
    • Peer Reviewed
  • [Journal Article] Prefix Alignment for Training Simultaneous Machine Translation2024

    • Author(s)
      Yasumasa Kano, Katsuhito Sudoh, Satoshi Nakamura
    • Journal Title

      Journal of Natural Language Processing

      Volume: 31 Issue: 1 Pages: 79-104

    • DOI

      10.5715/jnlp.31.79

    • ISSN
      1340-7619, 2185-8314
    • Related Report
      2023 Annual Research Report
    • Peer Reviewed / Open Access
  • [Presentation] 漸進的な音声分割を用いたストリーミング同時音声翻訳2024

    • Author(s)
      福田りょう, 須藤克仁, 中村哲
    • Organizer
      言語処理学会 第30回年次大会
    • Related Report
      2023 Annual Research Report
  • [Presentation] 文内コンテキストを利用した分割統治ニューラル機械翻訳2024

    • Author(s)
      石川隆太, 加納保昌, 須藤克仁, 中村哲
    • Organizer
      言語処理学会 第30回年次大会
    • Related Report
      2023 Annual Research Report
  • [Presentation] Average Token Delay: A Latency Metric for Simultaneous Translation2023

    • Author(s)
      Yasumasa Kano, Katsuhito Sudoh, Satoshi Nakamura
    • Organizer
      Interspeech 2023
    • Related Report
      2023 Annual Research Report
    • Int'l Joint Research
  • [Presentation] Average Token Delay: 同時通訳の遅延評価尺度2023

    • Author(s)
      加納保昌, 須藤克仁, 中村哲
    • Organizer
      日本通訳翻訳学会第24回年次大会
    • Related Report
      2023 Annual Research Report
  • [Presentation] 事前学習モデルによる分割統治ニューラル機械翻訳2023

    • Author(s)
      石川 隆太, 加納 保昌, 須藤 克仁, 中村 哲
    • Organizer
      言語処理学会 第29回年次大会
    • Related Report
      2022 Annual Research Report
  • [Presentation] ByT5 の Attention を用いたトークン結合2023

    • Author(s)
      田中康紀, 須藤克仁, 中村哲
    • Organizer
      言語処理学会 第29回年次大会
    • Related Report
      2022 Annual Research Report
  • [Presentation] Simultaneous Neural Machine Translation with Prefix Alignment2022

    • Author(s)
      Yasumasa Kano, Katsuhito Sudoh, Satoshi Nakamura
    • Organizer
      The 19th International Conference on Spoken Language Translation (IWSLT 2022)
    • Related Report
      2022 Annual Research Report
    • Int'l Joint Research
  • [Presentation] Speech Segmentation Optimization using Segmented Bilingual Speech Corpus for End-to-end Speech Translation2022

    • Author(s)
      Ryo Fukuda, Katsuhito Sudoh, Satoshi Nakamura
    • Organizer
      The 23rd Interspeech Conference (Interspeech 2022)
    • Related Report
      2022 Annual Research Report
    • Int'l Joint Research
  • [Presentation] 音声機械翻訳のための音声翻訳コーパスに基づく発話分割2022

    • Author(s)
      福田りょう, 須藤克仁, 中村哲
    • Organizer
      言語処理学会第28回年次大会
    • Related Report
      2021 Annual Research Report
  • [Presentation] 構文ラベル予測による同時ニューラル機械翻訳2022

    • Author(s)
      加納保昌, 須藤克仁, 中村哲
    • Organizer
      言語処理学会第28回年次大会
    • Related Report
      2021 Annual Research Report
  • [Presentation] Simultaneous Neural Machine Translation with Constituent Label Prediction2021

    • Author(s)
      Yasumasa Kano, Katsuhito Sudoh, Satoshi Nakamura
    • Organizer
      The Sixth Conference on Machine Translation
    • Related Report
      2021 Annual Research Report
    • Int'l Joint Research

URL: 

Published: 2021-04-28   Modified: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi