マルチモーダル品質推定に基づく機械翻訳モデルの高度化

研究課題

研究課題/領域番号	19K21533
補助金の研究課題番号	18H06465 (2018)
研究種目	研究活動スタート支援
配分区分	基金 (2019) 補助金 (2018)
審査区分	1001:情報科学、情報工学およびその関連分野
研究機関	大阪大学
研究代表者	梶原智之大阪大学, データビリティフロンティア機構, 特任助教(常勤) (70824960)
研究期間 (年度)	2018-08-24 – 2020-03-31
研究課題ステータス	完了 (2019年度)
配分額 *注記	2,730千円 (直接経費: 2,100千円、間接経費: 630千円) 2019年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円) 2018年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
キーワード	機械翻訳 / マルチモーダル / 知能情報学 / 自然言語処理 / 品質推定
研究開始時の研究の概要	2020年の東京五輪に向けて、機械翻訳の精度向上が急務である。従来の機械翻訳は、翻訳文と正解文の単語単位の一致率を最大化する訓練を行ってきたが、この正解文は数ある正しい翻訳の表現の一例に過ぎない。本研究では、マルチモーダル品質推定によって正解文の表現に依存しない訓練を行い、機械翻訳を高度化する。本研究の背景には、対訳などの大規模なテキストとテキストの対応データが一部の言語でしか利用できない一方で、SNSの普及により画像とテキストの対応データが多くの言語で大規模に利用できるという利点がある。
研究成果の概要	東京五輪に向けて、機械翻訳の精度向上が急務である。本研究では、機械翻訳の自動評価および画像を用いるマルチモーダル機械翻訳に取り組んだ。前者について、機械翻訳の訓練においては、正解文と表層的に異なる翻訳文は意味的に正しくともペナルティを受けてしまう。そこで、文のベクトル表現を用いる自動評価手法を提案し、正解文の表現への依存を減らしつつ人手評価との高い相関を達成した。後者について、従来のマルチモーダル機械翻訳では画像を等間隔に分割して利用しており、テキストとの対応付けが難しかった。そこで、意味的な単位に分割した画像を用いるマルチモーダル機械翻訳手法を提案し、性能の改善を確認した。
研究成果の学術的意義や社会的意義	東京五輪や大阪万博に向けて、機械翻訳の精度向上が急務である。機械翻訳モデルの効率的な改善のために、人手評価との高い相関を持つ自動評価手法の開発が重要である。本研究では、単語やフレーズの一致といった局所的な情報に頼っていた自動評価を改善し、文全体の大域的な情報をもとに人手評価との高い相関を持つ自動評価手法を構築した。機械翻訳に関する国際会議WMT-2018において開催された自動評価手法の性能を競うコンペティションにおいては、ドイツ語から英語や中国語から英語などの全7言語対において、我々の提案手法が世界最高性能を達成した。

報告書

(3件)

2019 実績報告書研究成果報告書 ( PDF )
2018 実績報告書

研究成果
(4件)

すべて 2020 2019 2018

すべて雑誌論文 (1件) (うち査読あり 1件、オープンアクセス 1件) 学会発表 (3件) (うち国際学会 2件)

[雑誌論文] 事前学習された文の分散表現を用いた機械翻訳の自動評価2019
- 著者名/発表者名
  嶋中宏希, 梶原智之, 小町守
- 雑誌名
  
  自然言語処理
  
  巻: 26 号: 3 ページ: 613-634
- DOI
  10.5715/jnlp.26.613
- NAID
  130007761392
- ISSN
  1340-7619, 2185-8314
- 年月日
  2019-09-15
- 関連する報告書
  2019 実績報告書
- 査読あり / オープンアクセス
[学会発表] Double Attention-based Multimodal Neural Machine Translation with Semantic Image Regions2020
- 著者名/発表者名
  Yuting Zhao, Mamoru Komachi, Tomoyuki Kajiwara, Chenhui Chu
- 学会等名
  Proceedings of the 22nd Annual Conference of the European Association for Machine Translation (EAMT 2020)
- 関連する報告書
  2019 実績報告書
- 国際学会
[学会発表] BERTを用いた機械翻訳の自動評価.2019
- 著者名/発表者名
  嶋中宏希, 梶原智之, 小町守.
- 学会等名
  言語処理学会第25回年次大会
- 関連する報告書
  2018 実績報告書
[学会発表] RUSE: Regressor Using Sentence Embeddings for Automatic Machine Translation Evaluation.2018
- 著者名/発表者名
  Hiroki Shimanaka, Tomoyuki Kajiwara, Mamoru Komachi.
- 学会等名
  Proceedings of the Third Conference on Machine Translation (WMT 18)
- 関連する報告書
  2018 実績報告書
- 国際学会

マルチモーダル品質推定に基づく機械翻訳モデルの高度化

研究代表者

梶原 智之 大阪大学, データビリティフロンティア機構, 特任助教(常勤) (70824960)

2,730千円 (直接経費: 2,100千円、間接経費: 630千円)

報告書

研究成果

[雑誌論文] 事前学習された文の分散表現を用いた機械翻訳の自動評価2019

著者名/発表者名

雑誌名

DOI

NAID

ISSN

年月日

関連する報告書

[学会発表] Double Attention-based Multimodal Neural Machine Translation with Semantic Image Regions2020

著者名/発表者名

学会等名

関連する報告書

[学会発表] BERTを用いた機械翻訳の自動評価.2019

著者名/発表者名

学会等名

関連する報告書

[学会発表] RUSE: Regressor Using Sentence Embeddings for Automatic Machine Translation Evaluation.2018

著者名/発表者名

学会等名

関連する報告書

梶原智之大阪大学, データビリティフロンティア機構, 特任助教(常勤) (70824960)