• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

知識グラフを統合したニューラル機械翻訳

研究課題

研究課題/領域番号 20K23325
研究種目

研究活動スタート支援

配分区分基金
審査区分 1001:情報科学、情報工学およびその関連分野
研究機関奈良先端科学技術大学院大学

研究代表者

渡辺 太郎  奈良先端科学技術大学院大学, 先端科学技術研究科, 教授 (90395038)

研究期間 (年度) 2020-09-11 – 2022-03-31
研究課題ステータス 完了 (2021年度)
配分額 *注記
2,860千円 (直接経費: 2,200千円、間接経費: 660千円)
2021年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2020年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
キーワード機械翻訳 / 知識グラフ / 自然言語処理 / 深層学習
研究開始時の研究の概要

深層学習により大幅な性能向上を果たしたニューラル機械翻訳は、モデルの学習のために、大量のデータを必要とする。ところが、データを増やすだけでは、個人名や会社名などの固有表現や、誕生日などの属性、所属先など他のオブジェクトとの関連性など、日々更新される知識を翻訳するのは難しい。本研究では、物事の属性および関連性を記述し、かつ、不完全ながらも多言語化された知識グラフを統合した機械翻訳を実現することで、問題が解決できるかを解明する。人間が記述した知識を効率よく利用することで、大量のデータに依存せずとも、高精度な翻訳を生成可能であることを明らかにする。

研究成果の概要

深層学習により大幅な性能向上を果たしたニューラル機械翻訳は、モデルの学習のために、大量のデータを必要とする。ところが、データを増やすだけでは、固有表現や、誕生日などの属性、所属先など他のオブジェクトとの関連性など、日々更新される知識を翻訳するのは難しい。本研究では、物事の属性および関連性を記述し、かつ、不完全ながらも多言語化された知識グラフを統合した機械翻訳を実現することで、問題が解決できるかを解明する。
本研究では、単語単位ではなく、サブワード単位に学習された知識グラフのベクトル表現を統合した機械翻訳モデルを実現した。機械翻訳実験の結果、人手評価で、固有表現が正しく翻訳されることを示した。

研究成果の学術的意義や社会的意義

本研究における知識グラフと機械翻訳を統合したモデルにより、知識を反映した機械翻訳を実現した。本手法により、人名や地名等の固有表現をより正しく翻訳できることを示している。今後は、知識グラフを更新することで機械翻訳モデルの再学習を全く必要としない機械翻訳モデルを実現することにより、各ドメインへと容易に適用可能、かつ、カスタマイズ可能なシステムの実現を目指す。

報告書

(3件)
  • 2021 実績報告書   研究成果報告書 ( PDF )
  • 2020 実施状況報告書
  • 研究成果

    (1件)

すべて 2021

すべて 学会発表 (1件)

  • [学会発表] 知識グラフ埋め込みを用いたニューラル機械翻訳におけるエンティティ表現の改良2021

    • 著者名/発表者名
      坂井優介, 渡辺太郎, 藤田篤
    • 学会等名
      言語処理学会第27回年次大会
    • 関連する報告書
      2021 実績報告書 2020 実施状況報告書

URL: 

公開日: 2020-09-29   更新日: 2023-01-30  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi