2020 年度実施状況報告書

深層学習における内部状態の統計的手法による表現と新しい学習手法の構築

研究課題

研究課題/領域番号	18K11449
研究機関	東京工科大学
研究代表者	柴田千尋東京工科大学, コンピュータサイエンス学部, 講師 (00633299)
研究分担者	持橋大地統計数理研究所, 数理・推論研究系, 准教授 (80418508) 吉仲亮東北大学, 情報科学研究科, 准教授 (80466424)
研究期間 (年度)	2018-04-01 – 2022-03-31
キーワード	表現学習 / 自然言語処理
研究実績の概要	深層ニューラルネット，とくにLSTM(超短期記憶)の解釈性，また，質の高い埋め込み表現の追求を行っているが，本年度は，LSTM が，どのように文脈を捉えるのか，LSTM 内のどの中間ベクトルに長期的な情報がどのようなメカニズムで捉えられるのかについて，追求を行った．その結果，品詞が状態更新ベクトルの空間中に最も顕著に獲得されていることや，”that”などの複数の意味を持つ機能語が，意味ごとにクラスタリングされていることなどが，実験を通して発見された．また，LSTM内部の，状態更新ベクトルにおける各要素のアクティベーションの値の学習前と学習後のヒストグラムの変化から，学習によって，量子化が進むことを示した．これは，LSTM内部の関連する重みパラメータが，学習により，より大きい分散を持つことになったことを意味している．より大きな分散を持つようになった理由としては，学習時にモデルを更新する際に，シグモイド関数や tanh 関数のもつ性質上，自然にそのようになるためで，この仕組が，学習が進んだときのロスや内部ベクトルの安定的な挙動にも寄与しているものと予想される．以上の結果は，LSTM を翻訳モデルなどに用いると，構文的な間違いをあまりしないことがよく知られているが，実際に，動詞や名詞などの，単語の持つ構文関する基本的な情報が，状態更新ベクトルの一部の部分空間で，自然に獲得されているということを意味する．
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由 LSTM内部の状態更新ベクトル内に，品詞等の情報が最も顕著に獲得されていることが判明するなど，いくつかの重要な発見があったため，概ね順調に推移していると言える．
今後の研究の推進方策	内部ベクトルの量子化を考慮した分布エンコーディングを考え，LSTMに対する適用可能性を探る．
次年度使用額が生じた理由	本年度の未使用額は，社会的に止む終えない理由(コロナの流行)が大きい．使用については，計算機の購入，学会参加費，クラウド使用量，計算機周辺機器等の消耗品費に当てる計画である．

研究成果
(1件)

すべて雑誌論文 (1件) (うち査読あり 1件、オープンアクセス 1件)

[雑誌論文] How LSTM Encodes Syntax: Exploring Context Vectors and Semi-Quantization on Natural Text2020
- 著者名/発表者名
  Shibata Chihiro、Uchiumi Kei、Mochihashi Daichi
- 雑誌名
  
  Proceedings of the 28th International Conference on Computational Linguistics
  
  巻: 0 ページ: 4033-4043
- DOI
  10.18653/v1/2020.coling-main.356
- 査読あり / オープンアクセス