2022 年度実施状況報告書

深層学習における内部状態の統計的手法による表現と新しい学習手法の構築

研究課題

研究課題/領域番号	18K11449
研究機関	法政大学
研究代表者	柴田千尋法政大学, 理工学部, 准教授 (00633299)
研究分担者	持橋大地統計数理研究所, 数理・推論研究系, 准教授 (80418508) 吉仲亮東北大学, 情報科学研究科, 准教授 (80466424)
研究期間 (年度)	2018-04-01 – 2024-03-31
キーワード	形式言語 / Transformer / RNN
研究実績の概要	昨年度に引き続き、本研究ではRNNやTransformerを対象とし、構文の構造がどのように表現されるかについて調査を行っている。Transformerは、任意の二つの離れた単語間の信号関係を計算するレイヤー（主にアテンション機構と呼ばれる）を積み重ねた構造を持っており、一般的に言ってより優れた言語モデルを構築可能とされているが、理論的な観点からは、RNNが表現できる言語クラスがより大きいとされている。本研究では、特定の言語クラスに属する人工言語からサンプルされた文の集合を訓練データとして使用し、RNNとTransformerの間に存在する性質上の違いについて実験を行った。用いた言語は主にサブレギュラーと呼ばれる、複雑さの階層をもつ言語クラス群からなり、文中に現れた単語の出現の回数や順序、隣接関係を記述可能なクラスである。また、わずかな違いを持つような敵対的テストデータと呼ばれる概念を提唱している。実験をすすめることで、学習モデルが持つ一定の性質が明らかになることが期待される。
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由研究が順調に進んでいる理由としては、複雑さの階層をもつサブレギュラー言語クラス群を対象にした適切な訓練データを用いてRNNとTransformerの性質を検証できる状態になったこと、敵対的テストデータを用いてモデルのロバスト性や性能を詳細に評価できることがあげられる。実験を進めることで学習モデルの性質が明らかになることが期待される。
今後の研究の推進方策	研究が順調に進んでいるため、引き続き実験と検証を行い、RNNとTransformerの性質上の違いについてより理解を深めることが重要である。これにより、例えば、学習モデルの解釈性に関する知見が得られ、今後の言語モデルの発展に寄与すると考える。
次年度使用額が生じた理由	コロナウイルスの影響で物品費と旅費を中心に次年度使用額が生じた。次年度は物品費(計算機，周辺機器等)および学会出張旅費として使用する。

研究成果
(1件)

すべて雑誌論文 (1件) (うち国際共著 1件、オープンアクセス 1件)

[雑誌論文] MLRegTest: A Benchmark for the Machine Learning of Regular Languages2023
- 著者名/発表者名
  Sam van der Poel, Dakotah Lambert, Kalina Kostyszyn, Tiantian Gao, Rahul Verma, Derek Andersen, Joanne Chau, Emily Peterson, Cody St. Clair, Paul Fodor, Chihiro Shibata, Jeffrey Heinz
- 雑誌名
  
  arXiv
  
  巻: 2304.07687 ページ: 1-38
- オープンアクセス / 国際共著