深層学習により大幅な性能向上を果たしたニューラル機械翻訳は、モデルの学習のために、大量のデータを必要とする。ところが、データを増やすだけでは、固有表現や、誕生日などの属性、所属先など他のオブジェクトとの関連性など、日々更新される知識を翻訳するのは難しい。本研究では、物事の属性および関連性を記述し、かつ、不完全ながらも多言語化された知識グラフを統合した機械翻訳を実現することで、問題が解決できるかを解明する。 本研究では、単語単位ではなく、サブワード単位に学習された知識グラフのベクトル表現を統合した機械翻訳モデルを実現した。機械翻訳実験の結果、人手評価で、固有表現が正しく翻訳されることを示した。
|