研究課題/領域番号 |
20K23325
|
研究種目 |
研究活動スタート支援
|
配分区分 | 基金 |
審査区分 |
1001:情報科学、情報工学およびその関連分野
|
研究機関 | 奈良先端科学技術大学院大学 |
研究代表者 |
渡辺 太郎 奈良先端科学技術大学院大学, 先端科学技術研究科, 教授 (90395038)
|
研究期間 (年度) |
2020-09-11 – 2022-03-31
|
研究課題ステータス |
完了 (2021年度)
|
配分額 *注記 |
2,860千円 (直接経費: 2,200千円、間接経費: 660千円)
2021年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2020年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
|
キーワード | 機械翻訳 / 知識グラフ / 自然言語処理 / 深層学習 |
研究開始時の研究の概要 |
深層学習により大幅な性能向上を果たしたニューラル機械翻訳は、モデルの学習のために、大量のデータを必要とする。ところが、データを増やすだけでは、個人名や会社名などの固有表現や、誕生日などの属性、所属先など他のオブジェクトとの関連性など、日々更新される知識を翻訳するのは難しい。本研究では、物事の属性および関連性を記述し、かつ、不完全ながらも多言語化された知識グラフを統合した機械翻訳を実現することで、問題が解決できるかを解明する。人間が記述した知識を効率よく利用することで、大量のデータに依存せずとも、高精度な翻訳を生成可能であることを明らかにする。
|
研究成果の概要 |
深層学習により大幅な性能向上を果たしたニューラル機械翻訳は、モデルの学習のために、大量のデータを必要とする。ところが、データを増やすだけでは、固有表現や、誕生日などの属性、所属先など他のオブジェクトとの関連性など、日々更新される知識を翻訳するのは難しい。本研究では、物事の属性および関連性を記述し、かつ、不完全ながらも多言語化された知識グラフを統合した機械翻訳を実現することで、問題が解決できるかを解明する。 本研究では、単語単位ではなく、サブワード単位に学習された知識グラフのベクトル表現を統合した機械翻訳モデルを実現した。機械翻訳実験の結果、人手評価で、固有表現が正しく翻訳されることを示した。
|
研究成果の学術的意義や社会的意義 |
本研究における知識グラフと機械翻訳を統合したモデルにより、知識を反映した機械翻訳を実現した。本手法により、人名や地名等の固有表現をより正しく翻訳できることを示している。今後は、知識グラフを更新することで機械翻訳モデルの再学習を全く必要としない機械翻訳モデルを実現することにより、各ドメインへと容易に適用可能、かつ、カスタマイズ可能なシステムの実現を目指す。
|