研究課題/領域番号 |
20K19864
|
研究機関 | 同志社大学 |
研究代表者 |
田村 晃裕 同志社大学, 理工学部, 准教授 (20804165)
|
研究期間 (年度) |
2020-04-01 – 2022-03-31
|
キーワード | ニューラル機械翻訳 / 同期式構文解析 / Transformer / ニューラルネットワーク / 機械翻訳 |
研究実績の概要 |
本研究は、ニューラルネットワークに基づく機械翻訳(NMT)の中で、特に、語順などの構造が異なる言語間(例えば、英語と日本語間)の翻訳に有効な「文構造に基づくNMT」の翻訳性能の改善を目指すものである。従来の文構造に基づくNMTが活用する翻訳元言語の文構造や翻訳先言語の文構造は、翻訳相手となる文の構造とは独立に解析される。そのため、活用する文構造が翻訳の手がかりとして最適であるとは限らない。一方で、NMT以前の統計的機械翻訳においては、翻訳元言語の文構造と翻訳先言語の文構造の間で対応をもたせた同期式構文解析の有効性が示されている。そこで本研究では、言語間で同期された文構造をNMTで活用することで翻訳性能の改善を目指す。 これまで同期式構文解析を活用するNMTは考案されていない。そして、NMTにおいて同期式構文解析の有効な組み込み方は自明ではない。そこで本研究では、NMTにおける同期式構文解析の組み込み方法として、(1)既存の同期式構文解析結果をNMTの入力として与えて活用する方法と(2)NMTモデル内で文構造を同期させる方法の二つを実現し、同期された文構造のNMTにおける有効性を検証する。 当該年度では、方法(2)を具体化・実装した。具体的には、近年最高の翻訳性能を達成して標準的なモデルとなったTransformer NMTモデルにおいて、自己注意機構と言語間注意機構を用いて文構造を同期させる方法を創出した。そして、ASPECデータを用いた日英翻訳実験を行い、構文情報を活用しないNMTモデル及び文構造に基づく従来のNMTモデルと比較し、翻訳性能の評価指標であるBLEUで、それぞれ0.70、0.27ポイント翻訳性能が向上することを確認した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
研究計画では、2年間の研究期間で、2種類の同期式構文解析の活用方法((1)既存の同期式構文解析結果をNMTの入力として与えて活用する方法と(2)NMTモデル内で文構造を同期させる方法)を試し、言語間で同期された文構造を利用することにより翻訳性能を改善することを目標としている。当該年度では2種類の方法のうち、方法(2)の具体化と実装を完了し、言語間で同期された文構造を使うことにより日英翻訳性能が改善できることを実験的に示した。残りの一年間で方法(1)のアルゴリズム化と実装、実験による効果検証を行えば本研究の目的は果たせる。以上のことからおおむね順調に進展していると考えられる。
|
今後の研究の推進方策 |
NMTにおける同期式構文解析の活用方法として、既存の同期式構文解析結果をNMTの入力として与えて活用する方法の具体化と実装を行う。そして、ASPECデータを用いた日英翻訳実験を通じて、提案手法の有効性を検証する。
|
次年度使用額が生じた理由 |
次年度使用額が生じた理由:計算サーバにアクセスするためのクライアントノートPCの購入を予定していたが、既存のノートPCを使用したため。また、新型コロナの影響で国内外の学会が全てオンライン開催になり、予定していた学会発表のための出張費が不要になったため。 使用計画:考案手法の効果を当初の予定より詳細に広範囲に検証するためには実験を効率よく進める必要がある。そのためには、次年度購入を予定しているGPU搭載計算サーバのスペックを当初計画していたものより上げる必要がある。差額はサーバの高スペック化に伴う増額分にあてる。
|