• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

自然言語の構成性に着目した機械翻訳の研究

研究課題

研究課題/領域番号 23K21697
補助金の研究課題番号 21H03500 (2021-2023)
研究種目

基盤研究(B)

配分区分基金 (2024)
補助金 (2021-2023)
応募区分一般
審査区分 小区分61030:知能情報学関連
研究機関奈良女子大学 (2024)
奈良先端科学技術大学院大学 (2021-2023)

研究代表者

須藤 克仁  奈良女子大学, 生活環境科学系, 教授 (00396152)

研究分担者 中村 哲  奈良先端科学技術大学院大学, 先端科学技術研究科, 教授 (30263429)
研究期間 (年度) 2021-04-01 – 2025-03-31
研究課題ステータス 交付 (2024年度)
配分額 *注記
17,290千円 (直接経費: 13,300千円、間接経費: 3,990千円)
2024年度: 2,600千円 (直接経費: 2,000千円、間接経費: 600千円)
2023年度: 4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2022年度: 5,850千円 (直接経費: 4,500千円、間接経費: 1,350千円)
2021年度: 4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)
キーワード機械翻訳 / 構成性 / 長文翻訳 / 文脈を考慮した翻訳 / 順送り訳 / 文脈依存翻訳 / 自然言語処理 / 音声翻訳 / 分割統治 / 深層学習
研究開始時の研究の概要

長く複雑な入力に対する頑健な機械翻訳の実現を目指し、(1)入力をより短く簡単な部分構造に分割して下訳を作成した後全体の訳を構成する分割統治的アプローチによる機械翻訳方式の実証と、(2)その際文脈情報を考慮することで必ずしも構成的でない自然言語の翻訳における頑健性向上を目指す。

研究実績の概要

2023年度は研究項目1と研究項目2を一部統合する形での取り組みを行った。
1) 分割統治型翻訳においては節分割により文内文脈情報が失われるという問題に対処するため、文内文脈情報を明示的に与えた形で翻訳モデルの学習を行うことにより、分割を要する複雑な構造の文に対する翻訳の自動評価値が向上することを示した。
2) 音声翻訳のための音声セグメント分割手法について、追加検証・分析を行い海外雑誌論文に採録された他、より短い時間幅で漸進的に音声分割を行う形のストリーミング同時音声翻訳手法を提案し、既存手法を上回る性能が得られることを示した。
3) 漸進的機械翻訳のための評価手法である Average Token Delay を提案し、昨年度提案した Prefix Alignment 法による漸進的機械翻訳の効果検証がより正確に行えるようになった。関連成果が国際会議論文1件採択、国内雑誌論文1件採録。
4) 細かい単位で入力分割を行う漸進的機械翻訳の研究用データとして、文内文脈を考慮しつつ適切な補足を加えた訳出を行う、500文規模の人手による順送り訳データの作成を行った。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

分割統治型翻訳については適用範囲が限られてはいるものの、適用範囲内で効果が得られることが分かり、また文内文脈情報の効果も明らかになったことから本研究計画の問いについて一定の前向きな結果が得られたと言える。
また、音声翻訳における入力発話分割やそれを推し進めた漸進的機械翻訳についても効率面・精度面での向上が達成でき、有効性を示すことができた。
データ整備については、当初計画の階層的な構造という形ではなく、漸進的な翻訳という方針に切り替え、少量だが高品質な順送り訳データを作成することができた。

今後の研究の推進方策

最終年度はこれまでの成果のさらなる検証と雑誌論文化を行うとともに、作成した順送り訳データの活用をすすめ、本研究計画のまとめとなる機械翻訳・音声翻訳技術を確立する。

報告書

(3件)
  • 2023 実績報告書
  • 2022 実績報告書
  • 2021 実績報告書
  • 研究成果

    (13件)

すべて 2024 2023 2022 2021

すべて 雑誌論文 (2件) (うち査読あり 2件、 オープンアクセス 1件) 学会発表 (11件) (うち国際学会 4件)

  • [雑誌論文] Improving Speech Translation Accuracy and Time Efficiency With Fine-Tuned wav2vec 2.0-Based Speech Segmentation2024

    • 著者名/発表者名
      Fukuda Ryo、Sudoh Katsuhito、Nakamura Satoshi
    • 雑誌名

      IEEE/ACM Transactions on Audio, Speech, and Language Processing

      巻: 32 ページ: 906-916

    • DOI

      10.1109/taslp.2023.3343614

    • 関連する報告書
      2023 実績報告書
    • 査読あり
  • [雑誌論文] Prefix Alignment for Training Simultaneous Machine Translation2024

    • 著者名/発表者名
      Yasumasa Kano, Katsuhito Sudoh, Satoshi Nakamura
    • 雑誌名

      自然言語処理

      巻: 31 号: 1 ページ: 79-104

    • DOI

      10.5715/jnlp.31.79

    • ISSN
      1340-7619, 2185-8314
    • 関連する報告書
      2023 実績報告書
    • 査読あり / オープンアクセス
  • [学会発表] 漸進的な音声分割を用いたストリーミング同時音声翻訳2024

    • 著者名/発表者名
      福田りょう, 須藤克仁, 中村哲
    • 学会等名
      言語処理学会 第30回年次大会
    • 関連する報告書
      2023 実績報告書
  • [学会発表] 文内コンテキストを利用した分割統治ニューラル機械翻訳2024

    • 著者名/発表者名
      石川隆太, 加納保昌, 須藤克仁, 中村哲
    • 学会等名
      言語処理学会 第30回年次大会
    • 関連する報告書
      2023 実績報告書
  • [学会発表] Average Token Delay: A Latency Metric for Simultaneous Translation2023

    • 著者名/発表者名
      Yasumasa Kano, Katsuhito Sudoh, Satoshi Nakamura
    • 学会等名
      Interspeech 2023
    • 関連する報告書
      2023 実績報告書
    • 国際学会
  • [学会発表] Average Token Delay: 同時通訳の遅延評価尺度2023

    • 著者名/発表者名
      加納保昌, 須藤克仁, 中村哲
    • 学会等名
      日本通訳翻訳学会第24回年次大会
    • 関連する報告書
      2023 実績報告書
  • [学会発表] 事前学習モデルによる分割統治ニューラル機械翻訳2023

    • 著者名/発表者名
      石川 隆太, 加納 保昌, 須藤 克仁, 中村 哲
    • 学会等名
      言語処理学会 第29回年次大会
    • 関連する報告書
      2022 実績報告書
  • [学会発表] ByT5 の Attention を用いたトークン結合2023

    • 著者名/発表者名
      田中康紀, 須藤克仁, 中村哲
    • 学会等名
      言語処理学会 第29回年次大会
    • 関連する報告書
      2022 実績報告書
  • [学会発表] Simultaneous Neural Machine Translation with Prefix Alignment2022

    • 著者名/発表者名
      Yasumasa Kano, Katsuhito Sudoh, Satoshi Nakamura
    • 学会等名
      The 19th International Conference on Spoken Language Translation (IWSLT 2022)
    • 関連する報告書
      2022 実績報告書
    • 国際学会
  • [学会発表] Speech Segmentation Optimization using Segmented Bilingual Speech Corpus for End-to-end Speech Translation2022

    • 著者名/発表者名
      Ryo Fukuda, Katsuhito Sudoh, Satoshi Nakamura
    • 学会等名
      The 23rd Interspeech Conference (Interspeech 2022)
    • 関連する報告書
      2022 実績報告書
    • 国際学会
  • [学会発表] 音声機械翻訳のための音声翻訳コーパスに基づく発話分割2022

    • 著者名/発表者名
      福田りょう, 須藤克仁, 中村哲
    • 学会等名
      言語処理学会第28回年次大会
    • 関連する報告書
      2021 実績報告書
  • [学会発表] 構文ラベル予測による同時ニューラル機械翻訳2022

    • 著者名/発表者名
      加納保昌, 須藤克仁, 中村哲
    • 学会等名
      言語処理学会第28回年次大会
    • 関連する報告書
      2021 実績報告書
  • [学会発表] Simultaneous Neural Machine Translation with Constituent Label Prediction2021

    • 著者名/発表者名
      Yasumasa Kano, Katsuhito Sudoh, Satoshi Nakamura
    • 学会等名
      The Sixth Conference on Machine Translation
    • 関連する報告書
      2021 実績報告書
    • 国際学会

URL: 

公開日: 2021-04-28   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi