本研究は、翻訳元言語と翻訳先言語間で対応させた文構造(同期式文構造)を活用することで、ニューラル機械翻訳(NMT)の性能改善を目指すものである。研究実施計画通り、(1)NMTモデル内で文構造を同期させる方法(2020年度及び2021年度)と(2)既存の同期式構文解析結果を活用する方法(2021年度)の2種類のNMTモデルを考案し、その効果を検証した。 方法(1)に関しては、2020年度に、最先端のNMTモデルであるTransformer NMTにおいて、自己注意機構と言語間注意機構により翻訳元言語と翻訳先言語の文構造の整合性をとる方法を考案した。そして、ASPECデータを用いた日英翻訳実験において、従来NMTよりも高い翻訳精度(+0.27 BLEUポイント)を達成した。また、最終年度には、WMT14データを用いた英独翻訳実験及びWMT16データを用いた英羅翻訳実験においても、従来NMTよりも高い翻訳精度(それぞれ、+0.38、+0.20 BLEUポイント)を実現し、提案モデルの汎用性を示した。 方法(2)に関しては、最終年度に、同期式構文解析をまず行い、その結果の文構造をTransformer NMTモデルに翻訳対象の文と共に入力して翻訳に活用する方法を考案した。そして、ASPECデータを用いた日英翻訳実験を行い、従来NMTとほぼ同程度の翻訳精度(+0.07 BLEUポイント)であることを確認した。 研究期間全体を通じて、種々の言語対において、同期式文構造がNMTの精度改善に役立つことを示した。また、同期式文構造を活用する際は、方法(1)の方が有効であることを示した。これは、方法(2)では同期式文構造が機械翻訳とは独立に導出されるのに対して、方法(1)では同期式文構造と翻訳を同時に最適化するため、NMTにより有用な文構造を活用できるからであると考えられる。
|