深層学習における内部状態の統計的手法による表現と新しい学習手法の構築

研究課題

研究課題/領域番号	18K11449
研究種目	基盤研究(C)
配分区分	基金
応募区分	一般
審査区分	小区分61030:知能情報学関連
研究機関	法政大学 (2021-2023) 東京工科大学 (2018-2020)
研究代表者	柴田千尋法政大学, 理工学部, 准教授 (00633299)
研究分担者	持橋大地統計数理研究所, 数理・推論研究系, 准教授 (80418508) 吉仲亮東北大学, 情報科学研究科, 准教授 (80466424)
研究期間 (年度)	2018-04-01 – 2024-03-31
研究課題ステータス	完了 (2023年度)
配分額 *注記	4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円) 2020年度: 650千円 (直接経費: 500千円、間接経費: 150千円) 2019年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円) 2018年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
キーワード	深層学習(ディープラーニング) / 形式言語理論 / 形式言語 / Transformer / RNN / 表現学習 / 自然言語処理 / 情報ボトルネック法 / 分布エンコーディング / 深層学習 / 内部表現 / LSTM / ディープラーニング / 統計的学習理論 / 時系列予測
研究成果の概要	深層学習のモデルが，内部でどのような処理を行っているのかを明らかにすることは，説明可能なAIへ向けてのアプローチの一つである．本研究では，実際に学習させたRNNやTransformerなどの深層学習モデルに対して，構文構造の観点から分析を行った．とくに形式言語モデルを用いて，どのような統語的(=構文的)特徴を学習することができ，それらがどのように内部ベクトルに表現されているかについて，一部明らかにし，追求を行った．また，内部表現以前の問題として，構文的には間違えているが僅かな違いしか持たないような敵対的なデータセットを用いて，深層学習モデルが本当に構文的な正誤を獲得できているのかを検証した．
研究成果の学術的意義や社会的意義	RNNやTransformer などの言語モデルがどの程度構文的な知識を獲得できるのか，また，獲得できるとすれば，それらがどのように埋め込まれるのか，言語モデルの理論に照らし合わせて追求することで，未だにブラックボックスである深層学習モデルの説明可能性に対して一定の方向性を示すことができたと考える．また，今後とも，形式言語クラスやそのアルゴリズム的学習の理論的な研究と，実際の産業で使われるような深層学習の分野との架け橋としての役割を果たしていきたい．

報告書

(7件)

研究成果
(8件)

すべて 2023 2021 2020 2019 2018

すべて雑誌論文 (7件) (うち国際共著 3件、査読あり 5件、オープンアクセス 6件) 学会発表 (1件)

[雑誌論文] TAYSIR Competition: Transformer+RNN: Algorithms to Yield Simple and Interpretable Representations.2023
- 著者名/発表者名
  Remi Eyraud, Dakotah Lambert, Badr Tahri Joutei, Aidar Gaffarov, Mathias Cabanne, Jeffrey Heinz, Chihiro Shibata
- 雑誌名
  
  Proceedings of Machine Learning Research
  
  巻: 217 ページ: 275-290
- 関連する報告書
  2023 実績報告書
- 査読あり / オープンアクセス / 国際共著
[雑誌論文] MLRegTest: A Benchmark for the Machine Learning of Regular Languages2023
- 著者名/発表者名
  Sam van der Poel, Dakotah Lambert, Kalina Kostyszyn, Tiantian Gao, Rahul Verma, Derek Andersen, Joanne Chau, Emily Peterson, Cody St. Clair, Paul Fodor, Chihiro Shibata, Jeffrey Heinz
- 雑誌名
  
  arXiv
  
  巻: 2304.07687 ページ: 1-38
- 関連する報告書
  2022 実施状況報告書
- オープンアクセス / 国際共著
[雑誌論文] Learning (k,l)-context-sensitive probabilistic grammars with nonparametric Bayesian approach2021
- 著者名/発表者名
  Shibata Chihiro
- 雑誌名
  
  Machine Learning
  
  巻: 7 号: 5 ページ: 3267-3301
- DOI
  10.1007/s10994-021-06034-2
- 関連する報告書
  2021 実施状況報告書
- 査読あり / オープンアクセス
[雑誌論文] 文字レベル畳み込みニューラルネットに対するトピック分布を用いた事前学習2020
- 著者名/発表者名
  守屋俊，柴田千尋
- 雑誌名
  
  電子情報通信学会論文誌D 情報・システム
  
  巻: J103-D 号: 4 ページ: 280-290
- DOI
  10.14923/transinfj.2019PDP0004
- ISSN
  1880-4535, 1881-0225
- 年月日
  2020-04-01
- 関連する報告書
  2019 実施状況報告書
- 査読あり
[雑誌論文] How LSTM Encodes Syntax: Exploring Context Vectors and Semi-Quantization on Natural Text2020
- 著者名/発表者名
  Shibata Chihiro、Uchiumi Kei、Mochihashi Daichi
- 雑誌名
  
  Proceedings of the 28th International Conference on Computational Linguistics
  
  巻: 0 ページ: 4033-4043
- DOI
  10.18653/v1/2020.coling-main.356
- NAID
  130008052569
- 関連する報告書
  2020 実施状況報告書
- 査読あり / オープンアクセス
[雑誌論文] 超球面上への分布エンコーディングを用いた文書分類2020
- 著者名/発表者名
  守屋俊, 町田秀輔, 柴田千尋
- 雑誌名
  
  言語処理学会第26回年次大会予稿集
  
  巻: None ページ: 1435-1438
- 関連する報告書
  2019 実施状況報告書
- オープンアクセス
[雑誌論文] Maximum Likelihood Estimation of Factored Regular Deterministic Stochastic Languages2019
- 著者名/発表者名
  Chihiro Shibata and Jeffrey Heinz
- 雑誌名
  
  In Proceedings of the 16th Meeting on the Mathematics of Language
  
  巻: None ページ: 102-113
- 関連する報告書
  2019 実施状況報告書
- 査読あり / オープンアクセス / 国際共著
[学会発表] 構文情報を陽に与えたときの LSTM-RNN による内部表現について2018
- 著者名/発表者名
  岡本(柴田) 千尋，内海慶，持橋大地
- 学会等名
  第237回自然言語処理研究会 2018年9月26日情報処理学会
- 関連する報告書
  2018 実施状況報告書

深層学習における内部状態の統計的手法による表現と新しい学習手法の構築

研究代表者

柴田 千尋 法政大学, 理工学部, 准教授 (00633299)

4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)

報告書

研究成果

[雑誌論文] TAYSIR Competition: Transformer+RNN: Algorithms to Yield Simple and Interpretable Representations.2023

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] MLRegTest: A Benchmark for the Machine Learning of Regular Languages2023

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Learning (k,l)-context-sensitive probabilistic grammars with nonparametric Bayesian approach2021

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] 文字レベル畳み込みニューラルネットに対するトピック分布を用いた事前学習2020

著者名/発表者名

雑誌名

DOI

ISSN

年月日

関連する報告書

[雑誌論文] How LSTM Encodes Syntax: Exploring Context Vectors and Semi-Quantization on Natural Text2020

著者名/発表者名

雑誌名

DOI

NAID

関連する報告書

[雑誌論文] 超球面上への分布エンコーディングを用いた文書分類2020

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Maximum Likelihood Estimation of Factored Regular Deterministic Stochastic Languages2019

著者名/発表者名

雑誌名

関連する報告書

[学会発表] 構文情報を陽に与えたときの LSTM-RNN による内部表現について2018

著者名/発表者名

学会等名

関連する報告書

柴田千尋法政大学, 理工学部, 准教授 (00633299)