研究課題/領域番号 |
19K21533
|
補助金の研究課題番号 |
18H06465 (2018)
|
研究種目 |
研究活動スタート支援
|
配分区分 | 基金 (2019) 補助金 (2018) |
審査区分 |
1001:情報科学、情報工学およびその関連分野
|
研究機関 | 大阪大学 |
研究代表者 |
梶原 智之 大阪大学, データビリティフロンティア機構, 特任助教(常勤) (70824960)
|
研究期間 (年度) |
2018-08-24 – 2020-03-31
|
研究課題ステータス |
完了 (2019年度)
|
配分額 *注記 |
2,730千円 (直接経費: 2,100千円、間接経費: 630千円)
2019年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2018年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
|
キーワード | 機械翻訳 / マルチモーダル / 知能情報学 / 自然言語処理 / 品質推定 |
研究開始時の研究の概要 |
2020年の東京五輪に向けて、機械翻訳の精度向上が急務である。従来の機械翻訳は、翻訳文と正解文の単語単位の一致率を最大化する訓練を行ってきたが、この正解文は数ある正しい翻訳の表現の一例に過ぎない。本研究では、マルチモーダル品質推定によって正解文の表現に依存しない訓練を行い、機械翻訳を高度化する。本研究の背景には、対訳などの大規模なテキストとテキストの対応データが一部の言語でしか利用できない一方で、SNSの普及により画像とテキストの対応データが多くの言語で大規模に利用できるという利点がある。
|
研究成果の概要 |
東京五輪に向けて、機械翻訳の精度向上が急務である。本研究では、機械翻訳の自動評価および画像を用いるマルチモーダル機械翻訳に取り組んだ。 前者について、機械翻訳の訓練においては、正解文と表層的に異なる翻訳文は意味的に正しくともペナルティを受けてしまう。そこで、文のベクトル表現を用いる自動評価手法を提案し、正解文の表現への依存を減らしつつ人手評価との高い相関を達成した。 後者について、従来のマルチモーダル機械翻訳では画像を等間隔に分割して利用しており、テキストとの対応付けが難しかった。そこで、意味的な単位に分割した画像を用いるマルチモーダル機械翻訳手法を提案し、性能の改善を確認した。
|
研究成果の学術的意義や社会的意義 |
東京五輪や大阪万博に向けて、機械翻訳の精度向上が急務である。機械翻訳モデルの効率的な改善のために、人手評価との高い相関を持つ自動評価手法の開発が重要である。本研究では、単語やフレーズの一致といった局所的な情報に頼っていた自動評価を改善し、文全体の大域的な情報をもとに人手評価との高い相関を持つ自動評価手法を構築した。機械翻訳に関する国際会議WMT-2018において開催された自動評価手法の性能を競うコンペティションにおいては、ドイツ語から英語や中国語から英語などの全7言語対において、我々の提案手法が世界最高性能を達成した。
|