自然言語処理における敵対的な摂動の高速な計算

研究課題

研究課題/領域番号	21K17800
研究種目	若手研究
配分区分	基金
審査区分	小区分61030:知能情報学関連
研究機関	東京工業大学
研究代表者	高瀬翔東京工業大学, 情報理工学院, 助教 (40817483)
研究期間 (年度)	2021-04-01 – 2023-03-31
研究課題ステータス	中途終了 (2022年度)
配分額 *注記	4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円) 2022年度: 2,080千円 (直接経費: 1,600千円、間接経費: 480千円) 2021年度: 2,600千円 (直接経費: 2,000千円、間接経費: 600千円)
キーワード	自然言語処理 / ニューラルネットワーク / 機械翻訳
研究開始時の研究の概要	本研究では自然言語処理を行うニューラルモデルについて、計算資源、特に学習時間に比して効果的な性能改善手法の実現を目指す。近年、翻訳や要約、文の意味計算など自然言語処理分野の様々なタスクにおいて、ニューラルネットワークを用いたモデルの性能改善を謳う研究が次々と発表されている。一方で、学習時間など計算資源に対する効率が議論されることは多くなく、実際、わずかな性能向上を達成するために、多量の計算時間やメモリを必要とする手法も多い。このような状況を鑑み、本研究では、頑健なモデル構築が可能であるが、極めて学習の遅い敵対的な摂動を用いた学習手法について、実用的な速度で同等の性能を達成する手法を実現する。
研究実績の概要	本研究の目的は、自然言語処理を行うニューラルモデルについて効率の良いモデルを構築することである。前年度では学習において効率の良い正則化手法を調査し、近年の研究で提案されている敵対的摂動よりも単語をランダムに置換するような簡便な手法の方が効率的であることを明らかにした。本年度は推論時の効率の向上に取り組んだ。ニューラルモデルでは複数のモデルの出力を統合するアンサンブルという手法により、1つのモデルのみを用いたときよりも性能が向上することが知られている。本年度はこのアンサンブルを1つのモデルで行う手法を考案した。具体的には、サブワード正則化という、系列を様々なサブワードに分割しモデルの頑健性を高める手法で学習したモデルについて、推論時にも様々なサブワードでの入力から出力を構築し、これを組み合わせることでアンサンブルの効果を達成した。本手法は、実際に複数モデルを構築しアンサンブルした性能には及ばないが、単一モデルの場合と比べ高い性能が達成可能であることを示した。また、推論に速度が必要な場合には、入力のサブワード列を単一のものとし、単一モデルと同じ計算時間で同等の性能を達成可能である。前年度の研究とあわせ、学習・推論の両方において計算時間について効率の良い手法を探求し、有用な結果を提示できた。加えて、前年度より調査している、パラメータ効率の良い手法について、機械翻訳や言語モデルのような自然言語処理のタスクだけではなく、自動音声認識でも効果があることを実験的に明らかにした。

報告書

(2件)

2022 実績報告書
2021 実施状況報告書

研究成果
(6件)

すべて 2022 2021

すべて雑誌論文 (3件) (うち査読あり 3件、オープンアクセス 3件) 学会発表 (3件) (うち国際学会 3件)

[雑誌論文] Single Model Ensemble for Subword Regularized Models in Low-Resource Machine Translation2022
- 著者名/発表者名
  Sho Takase, Tatsuya Hiraoka, Naoaki Okazaki
- 雑誌名
  
  Findings of the Association for Computational Linguistics: ACL 2022
  
  巻: Findings of ACL 2022 ページ: 2536-2541
- DOI
  10.18653/v1/2022.findings-acl.199
- 関連する報告書
  2022 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Multi-Task Learning for Cross-Lingual Abstractive Summarization2022
- 著者名/発表者名
  Sho Takase, Naoaki Okazaki
- 雑誌名
  
  Proceedings of the Thirteenth Language Resources and Evaluation Conference
  
  巻: LREC 2022 ページ: 3008-3016
- 関連する報告書
  2022 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Rethinking Perturbations in Encoder-Decoders for Fast Training2021
- 著者名/発表者名
  Sho Takase, Shun Kiyono
- 雑誌名
  
  Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies
  
  巻: NAACL 2021 ページ: 5767-5780
- DOI
  10.18653/v1/2021.naacl-main.460
- 関連する報告書
  2021 実施状況報告書
- 査読あり / オープンアクセス
[学会発表] Multi-Task Learning for Cross-Lingual Abstractive Summarization2022
- 著者名/発表者名
  高瀬翔
- 学会等名
  LREC 2022
- 関連する報告書
  2022 実績報告書
- 国際学会
[学会発表] Transformerを多層にする際の勾配消失問題と解決法について2022
- 著者名/発表者名
  高瀬翔
- 学会等名
  言語処理学会
- 関連する報告書
  2021 実施状況報告書
- 国際学会
[学会発表] Rethinking Perturbations in Encoder-Decoders for Fast Training2021
- 著者名/発表者名
  Sho Takase
- 学会等名
  NAACL
- 関連する報告書
  2021 実施状況報告書
- 国際学会

自然言語処理における敵対的な摂動の高速な計算

研究代表者

高瀬 翔 東京工業大学, 情報理工学院, 助教 (40817483)

4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)

報告書

研究成果

[雑誌論文] Single Model Ensemble for Subword Regularized Models in Low-Resource Machine Translation2022

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Multi-Task Learning for Cross-Lingual Abstractive Summarization2022

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Rethinking Perturbations in Encoder-Decoders for Fast Training2021

著者名/発表者名

雑誌名

DOI

関連する報告書

[学会発表] Multi-Task Learning for Cross-Lingual Abstractive Summarization2022

著者名/発表者名

学会等名

関連する報告書

[学会発表] Transformerを多層にする際の勾配消失問題と解決法について2022

著者名/発表者名

学会等名

関連する報告書

[学会発表] Rethinking Perturbations in Encoder-Decoders for Fast Training2021

著者名/発表者名

学会等名

関連する報告書

高瀬翔東京工業大学, 情報理工学院, 助教 (40817483)