2020 Fiscal Year Research-status Report
Project/Area Number |
20K19861
|
Research Institution | Ehime University |
Principal Investigator |
梶原 智之 愛媛大学, 理工学研究科(工学系), 助教 (70824960)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Keywords | 機械翻訳 / 品質推定 / 強化学習 |
Outline of Annual Research Achievements |
今年度は、主に機械翻訳の品質推定に取り組んだ。複数言語のデータを用いて単語穴埋めの事前学習を行ったXLM-Rモデルをベースに、入力文と機械翻訳による出力文の文対から翻訳品質を推定する転移学習を実施し、機械翻訳の品質推定モデルを構築した。特に、各文の文頭に言語識別を補助するための特殊トークンを追加することによって、品質推定の性能が向上することを明らかにした。機械翻訳に関する国際会議WMTにおいて品質推定のコンペティションに参加した結果、人手評価との誤差に関して2位を記録した。その他、文法誤り訂正およびテキスト平易化のタスクにおいても品質推定に取り組んだ。これらのタスクは、誤りを含む英語から正しい英語への機械翻訳、または、難解な英語から平易な英語への機械翻訳、という単一言語内の機械翻訳タスクと考えることができる。言語をまたがないため、品質推定や強化学習の適用が機械翻訳よりも容易ではないかと考え、これらの関連タスクにも取り組んでいる。文法誤り訂正のタスクでは、システム出力文に人手評価値を付与したデータセットを構築し、公開した。このデータセットを用いて、機械翻訳と同様に品質推定を実現できることを示した。テキスト平易化のタスクでは、品質推定の結果を報酬とする強化学習に取り組み、テキスト平易化の品質が改善することを確認した。今後は、これの半教師あり学習への発展および機械翻訳タスクへの適用に取り組む。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
品質推定および強化学習の研究に取り組み、知見を得ることができた。
|
Strategy for Future Research Activity |
今年度は、同一言語内の機械翻訳タスク(テキスト平易化)において、品質推定に基づく強化学習のアプローチの有効性を検証した。今年度の取り組みは教師あり学習の範疇であるため、教師なしデータを加えて、これを半教師あり学習の設定に拡張する。さらに、このアプローチを機械翻訳に適用する。
|
Causes of Carryover |
新型コロナウイルスの影響により、学会等への出張がなくなり、旅費の支出がなくなったため。
|