2020 年度実施状況報告書

品質推定に基づく半教師あり機械翻訳

研究課題

研究課題/領域番号	20K19861
研究機関	愛媛大学
研究代表者	梶原智之愛媛大学, 理工学研究科(工学系), 助教 (70824960)
研究期間 (年度)	2020-04-01 – 2024-03-31
キーワード	機械翻訳 / 品質推定 / 強化学習
研究実績の概要	今年度は、主に機械翻訳の品質推定に取り組んだ。複数言語のデータを用いて単語穴埋めの事前学習を行ったXLM-Rモデルをベースに、入力文と機械翻訳による出力文の文対から翻訳品質を推定する転移学習を実施し、機械翻訳の品質推定モデルを構築した。特に、各文の文頭に言語識別を補助するための特殊トークンを追加することによって、品質推定の性能が向上することを明らかにした。機械翻訳に関する国際会議WMTにおいて品質推定のコンペティションに参加した結果、人手評価との誤差に関して2位を記録した。その他、文法誤り訂正およびテキスト平易化のタスクにおいても品質推定に取り組んだ。これらのタスクは、誤りを含む英語から正しい英語への機械翻訳、または、難解な英語から平易な英語への機械翻訳、という単一言語内の機械翻訳タスクと考えることができる。言語をまたがないため、品質推定や強化学習の適用が機械翻訳よりも容易ではないかと考え、これらの関連タスクにも取り組んでいる。文法誤り訂正のタスクでは、システム出力文に人手評価値を付与したデータセットを構築し、公開した。このデータセットを用いて、機械翻訳と同様に品質推定を実現できることを示した。テキスト平易化のタスクでは、品質推定の結果を報酬とする強化学習に取り組み、テキスト平易化の品質が改善することを確認した。今後は、これの半教師あり学習への発展および機械翻訳タスクへの適用に取り組む。
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由品質推定および強化学習の研究に取り組み、知見を得ることができた。
今後の研究の推進方策	今年度は、同一言語内の機械翻訳タスク（テキスト平易化）において、品質推定に基づく強化学習のアプローチの有効性を検証した。今年度の取り組みは教師あり学習の範疇であるため、教師なしデータを加えて、これを半教師あり学習の設定に拡張する。さらに、このアプローチを機械翻訳に適用する。
次年度使用額が生じた理由	新型コロナウイルスの影響により、学会等への出張がなくなり、旅費の支出がなくなったため。

研究成果
(3件)

すべて 2020

すべて学会発表 (3件) (うち国際学会 3件)

[学会発表] Text Simplification with Reinforcement Learning using Supervised Rewards on Grammaticality, Meaning Preservation, and Simplicity2020
- 著者名/発表者名
  Akifumi Nakamachi, Tomoyuki Kajiwara, Yuki Arase
- 学会等名
  Proceedings of the AACL-IJCNLP 2020 Student Research Workshop
- 国際学会
[学会発表] SOME: Reference-less Sub-Metrics Optimized for Manual Evaluations of Grammatical Error Correction2020
- 著者名/発表者名
  Ryoma Yoshimura, Masahiro Kaneko, Tomoyuki Kajiwara, Mamoru Komachi
- 学会等名
  Proceedings of the 28th International Conference on Computational Linguistics
- 国際学会
[学会発表] TMUOU Submission for WMT20 Quality Estimation Shared Task2020
- 著者名/発表者名
  Akifumi Nakamachi, Hiroki Shimanaka, Tomoyuki Kajiwara, Mamoru Komachi
- 学会等名
  Proceedings of the Fifth Conference on Machine Translation
- 国際学会

2020 年度 実施状況報告書

品質推定に基づく半教師あり機械翻訳

研究代表者

梶原 智之 愛媛大学, 理工学研究科(工学系), 助教 (70824960)

現在までの達成度 (区分)

理由

研究成果

[学会発表] Text Simplification with Reinforcement Learning using Supervised Rewards on Grammaticality, Meaning Preservation, and Simplicity2020

著者名/発表者名

学会等名

[学会発表] SOME: Reference-less Sub-Metrics Optimized for Manual Evaluations of Grammatical Error Correction2020

著者名/発表者名

学会等名

[学会発表] TMUOU Submission for WMT20 Quality Estimation Shared Task2020

著者名/発表者名

学会等名

2020 年度実施状況報告書

梶原智之愛媛大学, 理工学研究科(工学系), 助教 (70824960)