• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2020 年度 実績報告書

大規模データにおけるエンコーダ・デコーダモデルの効率的な学習

研究課題

研究課題/領域番号 18K18119
研究機関東京工業大学

研究代表者

高瀬 翔  東京工業大学, 情報理工学院, 助教 (40817483)

研究期間 (年度) 2018-04-01 – 2021-03-31
キーワード自然言語処理 / ニューラルネットワーク / 機械翻訳
研究実績の概要

本研究の目的は逐次的にモデルを更新可能なエンコーダ・デコーダモデルの実現である。具体的には、大量の学習データで学習済みの、高性能なエンコーダ・デ
コーダについて、学習データが追加された際に、既存の学習データも含めた全データでの学習ではなく、新規に追加された学習データでのみ学習を行ったモデル
を用意し、大量のデータで学習したモデルと適切に組み合わせる手法の実現を目指す。最終年度は、モデルの組み合わせ手法に関する研究を行った。具体的には、Mixture of Expertsの考えを応用し、学習済みの複数のモデルについて、与えられた入力に適切なモデルを選択可能になるようなネットワークの設計、学習を行った。Mixture of Expertsでは、すべてのモデルを均等に使用せず、特定のモデルのみを使用してしまうという状況がままある、これを防ぐために、モデル選択の分散が大きくなるような制約を導入したが、全体の性能が下がってしまい、上手く作用しない結果となってしまった。
一方で、モデルの組み合わせ方法を応用し、基底ベクトルの組み合わせで埋め込みを構築する手法の研究を行った。これは、ランダムベクトルを基底ベクトルとして用意しておき、この組み合わせで各単語のベクトル表現(埋め込み表現)を計算するものである。元来の埋め込み表現は語彙数分のベクトルを用意する必要があったため、パラメータ数が膨大になってしまっていたが、これの大幅な削減を可能とした。この成果は、機械学習分野のトップ会議である、NeurIPSに採択され、発表を行った。

  • 研究成果

    (1件)

すべて 2020

すべて 学会発表 (1件) (うち国際学会 1件)

  • [学会発表] All Word Embeddings from One Embedding2020

    • 著者名/発表者名
      Sho Takase, Sosuke Kobayashi
    • 学会等名
      Neural Information Processing Systems
    • 国際学会

URL: 

公開日: 2021-12-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi