• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2020 Fiscal Year Research-status Report

同期式構文解析に基づくニューラル機械翻訳に関する研究

Research Project

Project/Area Number 20K19864
Research InstitutionDoshisha University

Principal Investigator

田村 晃裕  同志社大学, 理工学部, 准教授 (20804165)

Project Period (FY) 2020-04-01 – 2022-03-31
Keywordsニューラル機械翻訳 / 同期式構文解析 / Transformer / ニューラルネットワーク / 機械翻訳
Outline of Annual Research Achievements

本研究は、ニューラルネットワークに基づく機械翻訳(NMT)の中で、特に、語順などの構造が異なる言語間(例えば、英語と日本語間)の翻訳に有効な「文構造に基づくNMT」の翻訳性能の改善を目指すものである。従来の文構造に基づくNMTが活用する翻訳元言語の文構造や翻訳先言語の文構造は、翻訳相手となる文の構造とは独立に解析される。そのため、活用する文構造が翻訳の手がかりとして最適であるとは限らない。一方で、NMT以前の統計的機械翻訳においては、翻訳元言語の文構造と翻訳先言語の文構造の間で対応をもたせた同期式構文解析の有効性が示されている。そこで本研究では、言語間で同期された文構造をNMTで活用することで翻訳性能の改善を目指す。
これまで同期式構文解析を活用するNMTは考案されていない。そして、NMTにおいて同期式構文解析の有効な組み込み方は自明ではない。そこで本研究では、NMTにおける同期式構文解析の組み込み方法として、(1)既存の同期式構文解析結果をNMTの入力として与えて活用する方法と(2)NMTモデル内で文構造を同期させる方法の二つを実現し、同期された文構造のNMTにおける有効性を検証する。
当該年度では、方法(2)を具体化・実装した。具体的には、近年最高の翻訳性能を達成して標準的なモデルとなったTransformer NMTモデルにおいて、自己注意機構と言語間注意機構を用いて文構造を同期させる方法を創出した。そして、ASPECデータを用いた日英翻訳実験を行い、構文情報を活用しないNMTモデル及び文構造に基づく従来のNMTモデルと比較し、翻訳性能の評価指標であるBLEUで、それぞれ0.70、0.27ポイント翻訳性能が向上することを確認した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

研究計画では、2年間の研究期間で、2種類の同期式構文解析の活用方法((1)既存の同期式構文解析結果をNMTの入力として与えて活用する方法と(2)NMTモデル内で文構造を同期させる方法)を試し、言語間で同期された文構造を利用することにより翻訳性能を改善することを目標としている。当該年度では2種類の方法のうち、方法(2)の具体化と実装を完了し、言語間で同期された文構造を使うことにより日英翻訳性能が改善できることを実験的に示した。残りの一年間で方法(1)のアルゴリズム化と実装、実験による効果検証を行えば本研究の目的は果たせる。以上のことからおおむね順調に進展していると考えられる。

Strategy for Future Research Activity

NMTにおける同期式構文解析の活用方法として、既存の同期式構文解析結果をNMTの入力として与えて活用する方法の具体化と実装を行う。そして、ASPECデータを用いた日英翻訳実験を通じて、提案手法の有効性を検証する。

Causes of Carryover

次年度使用額が生じた理由:計算サーバにアクセスするためのクライアントノートPCの購入を予定していたが、既存のノートPCを使用したため。また、新型コロナの影響で国内外の学会が全てオンライン開催になり、予定していた学会発表のための出張費が不要になったため。
使用計画:考案手法の効果を当初の予定より詳細に広範囲に検証するためには実験を効率よく進める必要がある。そのためには、次年度購入を予定しているGPU搭載計算サーバのスペックを当初計画していたものより上げる必要がある。差額はサーバの高スペック化に伴う増額分にあてる。

  • Research Products

    (7 results)

All 2021 2020

All Presentation (7 results) (of which Int'l Joint Research: 2 results)

  • [Presentation] 同期注意制約を与えた依存構造に基づくTransformer NMT2021

    • Author(s)
      出口 祥之, 田村 晃裕, 二宮 崇
    • Organizer
      言語処理学会 第27回年次大会
  • [Presentation] ニューラル機械翻訳のためのアテンション確率のスムージングとゲーティング学習2021

    • Author(s)
      張 瀟廬, 二宮 崇, 田村 晃裕
    • Organizer
      言語処理学会 第27回年次大会
  • [Presentation] 画像生成による疑似教師データを用いたマルチモーダルニューラル機械翻訳2021

    • Author(s)
      岩本 裕司, 田村 晃裕, 二宮 崇
    • Organizer
      言語処理学会 第27回年次大会
  • [Presentation] Supervised Visual Attention for Multimodal Neural Machine Translation2020

    • Author(s)
      Tetsuro Nishihara, Akihiro Tamura, Takashi Ninomiya, Yutaro Omote, Hideki Nakayama
    • Organizer
      The 28th International Conference on Computational Linguistics
    • Int'l Joint Research
  • [Presentation] Bilingual Subword Segmentation for Neural Machine Translation2020

    • Author(s)
      Hiroyuki Deguchi, Masao Utiyama, Akihiro Tamura, Takashi Ninomiya, Eiichiro Sumita
    • Organizer
      The 28th International Conference on Computational Linguistics
    • Int'l Joint Research
  • [Presentation] ニューラル機械翻訳のためのバイリンガルなサブワード分割2020

    • Author(s)
      出口 祥之,内山 将夫,田村 晃裕,二宮 崇,隅田 英一郎
    • Organizer
      情報処理学会 第246回自然言語処理研究会
  • [Presentation] 画像生成による疑似教師データを用いたマルチモーダル機械翻訳2020

    • Author(s)
      岩本 裕司,田村 晃裕,二宮 崇
    • Organizer
      情報処理学会 第246回自然言語処理研究会

URL: 

Published: 2021-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi