2018 年度実施状況報告書

深層学習における内部状態の統計的手法による表現と新しい学習手法の構築

研究課題

研究課題/領域番号	18K11449
研究機関	東京工科大学
研究代表者	柴田千尋東京工科大学, コンピュータサイエンス学部, 講師 (00633299)
研究分担者	持橋大地統計数理研究所, 数理・推論研究系, 准教授 (80418508) 吉仲亮東北大学, 情報科学研究科, 准教授 (80466424)
研究期間 (年度)	2018-04-01 – 2021-03-31
キーワード	深層学習 / 内部表現 / 自然言語処理 / LSTM
研究実績の概要	自然言語や運転操作の履歴など，記号化された時系列データにおいて，長短期記憶リカレントニューラルネットワーク(LSTM-RNN)や，ゲートリカレントニューラルネットワーク(GRU-RNN)などのRNNが，どのように，どの程度，長期の依存関係や，自然言語における構文情報を捉えるのかについて，近年様々な研究が行われている．しかし，実際に，内部表現にまで踏み込んで議論ができている研究例は我々の知る限りごく小数であることが現状である．近年，真相ニューラルネットワーク(DNN)を単にブラックボックスとして使うだけでなく，実際にその内部でどのような挙動をしているのかについて，人間が理解できる形で提示すること(説明可能性)が求められている．畳み込みニューラルネットワーク(CNN)については，ある程度，その内部の挙動が理解されつつある．一方で，RNN においては，内部の挙動について，未だ説明可能な形で解明がなされていない．そこで，我々はその初歩として，英語における句構造をあらわす構文木を線形化し文として与えて学習させたときに，RNN内で構文情報がどのようにエンコードされるかについて詳細に分析した．その結果，構文と，LSTMの状態ベクトルの間にある程度の相関関係が見られた．この結果は，構文がどのようにLSTMの内部ベクトルに埋め込まれるかを明らかにしていくベースとなる研究成果であると考えられる．また，教師なしクラスタリングのように，意味が類似している場合，ベクトルも類似することが観測されている．
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由 LSTMの内部表現の探索を行うことができている状況である．その結果，ある程度の意味の埋め込み表現を観測することができている．未だ研究は初期段階ではあるが，深層学習の内部表現の理解は，現在盛んに社会から求められている，「説明可能なAI」へ向けての礎になる可能性があり，その内部表現について，一部ではあるが，分析結果が得られたという事実は，重要である．したがって，研究はおおむね順調であるといえる．
今後の研究の推進方策	今後も引き続き，内部表現の分析を行っていく予定である．その際，より深くまで踏み込めるよう，様々な統計的手法を駆使する必要がある．そういった手法について，研究分担者と協力し，最適なものを探索していく．
次年度使用額が生じた理由	予定していた国際会議に参加しなかったため旅費の支出がなかった．また，今年度は，計算機を，既存のもので代用したため，購入を延期した．次年度は，国際会議に参加するとともに，古くなった計算機の更新などを予定している．

研究成果
(1件)

すべて学会発表 (1件)

[学会発表] 構文情報を陽に与えたときの LSTM-RNN による内部表現について2018
- 著者名/発表者名
  岡本(柴田) 千尋，内海慶，持橋大地
- 学会等名
  第237回自然言語処理研究会 2018年9月26日情報処理学会