• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2020 Fiscal Year Research-status Report

品質推定に基づく半教師あり機械翻訳

Research Project

Project/Area Number 20K19861
Research InstitutionEhime University

Principal Investigator

梶原 智之  愛媛大学, 理工学研究科(工学系), 助教 (70824960)

Project Period (FY) 2020-04-01 – 2024-03-31
Keywords機械翻訳 / 品質推定 / 強化学習
Outline of Annual Research Achievements

今年度は、主に機械翻訳の品質推定に取り組んだ。複数言語のデータを用いて単語穴埋めの事前学習を行ったXLM-Rモデルをベースに、入力文と機械翻訳による出力文の文対から翻訳品質を推定する転移学習を実施し、機械翻訳の品質推定モデルを構築した。特に、各文の文頭に言語識別を補助するための特殊トークンを追加することによって、品質推定の性能が向上することを明らかにした。機械翻訳に関する国際会議WMTにおいて品質推定のコンペティションに参加した結果、人手評価との誤差に関して2位を記録した。その他、文法誤り訂正およびテキスト平易化のタスクにおいても品質推定に取り組んだ。これらのタスクは、誤りを含む英語から正しい英語への機械翻訳、または、難解な英語から平易な英語への機械翻訳、という単一言語内の機械翻訳タスクと考えることができる。言語をまたがないため、品質推定や強化学習の適用が機械翻訳よりも容易ではないかと考え、これらの関連タスクにも取り組んでいる。文法誤り訂正のタスクでは、システム出力文に人手評価値を付与したデータセットを構築し、公開した。このデータセットを用いて、機械翻訳と同様に品質推定を実現できることを示した。テキスト平易化のタスクでは、品質推定の結果を報酬とする強化学習に取り組み、テキスト平易化の品質が改善することを確認した。今後は、これの半教師あり学習への発展および機械翻訳タスクへの適用に取り組む。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

品質推定および強化学習の研究に取り組み、知見を得ることができた。

Strategy for Future Research Activity

今年度は、同一言語内の機械翻訳タスク(テキスト平易化)において、品質推定に基づく強化学習のアプローチの有効性を検証した。今年度の取り組みは教師あり学習の範疇であるため、教師なしデータを加えて、これを半教師あり学習の設定に拡張する。さらに、このアプローチを機械翻訳に適用する。

Causes of Carryover

新型コロナウイルスの影響により、学会等への出張がなくなり、旅費の支出がなくなったため。

  • Research Products

    (3 results)

All 2020

All Presentation (3 results) (of which Int'l Joint Research: 3 results)

  • [Presentation] Text Simplification with Reinforcement Learning using Supervised Rewards on Grammaticality, Meaning Preservation, and Simplicity2020

    • Author(s)
      Akifumi Nakamachi, Tomoyuki Kajiwara, Yuki Arase
    • Organizer
      Proceedings of the AACL-IJCNLP 2020 Student Research Workshop
    • Int'l Joint Research
  • [Presentation] SOME: Reference-less Sub-Metrics Optimized for Manual Evaluations of Grammatical Error Correction2020

    • Author(s)
      Ryoma Yoshimura, Masahiro Kaneko, Tomoyuki Kajiwara, Mamoru Komachi
    • Organizer
      Proceedings of the 28th International Conference on Computational Linguistics
    • Int'l Joint Research
  • [Presentation] TMUOU Submission for WMT20 Quality Estimation Shared Task2020

    • Author(s)
      Akifumi Nakamachi, Hiroki Shimanaka, Tomoyuki Kajiwara, Mamoru Komachi
    • Organizer
      Proceedings of the Fifth Conference on Machine Translation
    • Int'l Joint Research

URL: 

Published: 2021-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi