2021 年度実績報告書

モデルベース強化学習のための変分自己符号化器を用いた系列モデルの開発

研究課題

研究課題/領域番号	20J11448
研究機関	東京大学
研究代表者	阿久澤圭東京大学, 工学系研究科, 特別研究員(DC2)
研究期間 (年度)	2020-04-24 – 2022-03-31
キーワード	深層学習 / 強化学習 / 生成モデル / 深層系列モデル / 系列モデル / 自然言語処理 / 音声信号処理
研究実績の概要	本研究は過去の観測系列を圧縮して大域的な表現を推論することができる深層系列生成モデルの開発を行い，それをモデルベース強化学習に応用することを目指すものである．本年度は，昨年度に投稿または採録された二つの研究について学会誌への採録や国際学会での発表を行うとともに，新たに二つの研究課題に取り組んだ（a, b）． (a) 視覚と言語の対応づけのための軌道の大域表現の半教師あり学習：昨年度から取り組んでいる内容について国内学会での発表を行うともに，それを発展させた研究について国際学会への投稿を行なった．研究内容としては，エージェントの軌道（画像と行動の系列）が与えられたときに，その軌道とそれを記述する言語指示の対応づけを学習する手法の開発を行うものである．提案手法は，言語指示が軌道の大域的な表現とみなすことができるという性質を利用し，深層系列生成モデルを用いた大域表現学習を補助タスクとして利用する．加えて，軌道と自然言語という二つのモダリティおよび系列長が異なるデータの潜在表現を学習するのに適した，新たなニューラルネットアーキテクチャを提案した． (b) 階層型深層生成モデルを利用した音声変換：本年度から新たに取り組んだ研究が国際学会に採択され，また同国際学会で発表を行なった．研究(a)に示唆されるように，系列の大域的な表現はモデルベース強化学習において役立つ可能性がある．本研究は，系列の大域的な表現の学習を改善するための新たなアプローチの検討と位置付けることができる．本研究はRate-Distortion分析により，表現が特定の情報に対して不変でありかつ生成モデルとしての尤度を高く保つためにはモデルの表現力が十分大きい必要があることを確認した．そして音声変換のタスクで実験を行い，高いモデル表現力を持つ階層型深層生成モデルは表現の不変性と尤度を高い水準で両立できることを示した．
現在までの達成度 (段落)	令和3年度が最終年度であるため、記入しない。
今後の研究の推進方策	令和3年度が最終年度であるため、記入しない。

研究成果
(5件)

すべて 2021

すべて雑誌論文 (1件) (うち査読あり 1件、オープンアクセス 1件) 学会発表 (4件) (うち国際学会 3件)

[雑誌論文] Information-theoretic regularization for learning global features by sequential VAE2021
- 著者名/発表者名
  Akuzawa Kei、Iwasawa Yusuke、Matsuo Yutaka
- 雑誌名
  
  Machine Learning
  
  巻: 110 ページ: 2239～2266
- DOI
  10.1007/s10994-021-06032-4
- 査読あり / オープンアクセス
[学会発表] ナビゲーション課題における視覚と言語の対応づけのための軌道の大域表現の半教師あり学習2021
- 著者名/発表者名
  阿久澤圭，岩澤有祐，松尾豊
- 学会等名
  人工知能学会全国大会（第35回）
[学会発表] Estimating Disentangled Belief about Hidden State and Hidden Task for Meta-Reinforcement Learning2021
- 著者名/発表者名
  Kei Akuzawa 、Yusuke Iwasawa、Yutaka Matsuo
- 学会等名
  the Third Learning for Dynamics and Control (L4DC) Conference
- 国際学会
[学会発表] Information-theoretic regularization for learning global features by sequential VAE2021
- 著者名/発表者名
  Kei Akuzawa 、Yusuke Iwasawa、Yutaka Matsuo
- 学会等名
  the European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases
- 国際学会
[学会発表] Conditional Deep Hierarchical Variational Autoencoder for Voice Conversion2021
- 著者名/発表者名
  Kei Akuzawa, Kotaro Onishi, Keisuke Takiguchi, Kohki Mametani, Koichiro Mori
- 学会等名
  13th Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC)
- 国際学会

2021 年度 実績報告書

モデルベース強化学習のための変分自己符号化器を用いた系列モデルの開発

研究代表者

阿久澤 圭 東京大学, 工学系研究科, 特別研究員(DC2)

研究成果

[雑誌論文] Information-theoretic regularization for learning global features by sequential VAE2021

著者名/発表者名

雑誌名

DOI

[学会発表] ナビゲーション課題における視覚と言語の対応づけのための軌道の大域表現の半教師あり学習2021

著者名/発表者名

学会等名

[学会発表] Estimating Disentangled Belief about Hidden State and Hidden Task for Meta-Reinforcement Learning2021

著者名/発表者名

学会等名

[学会発表] Information-theoretic regularization for learning global features by sequential VAE2021

著者名/発表者名

学会等名

[学会発表] Conditional Deep Hierarchical Variational Autoencoder for Voice Conversion2021

著者名/発表者名

学会等名

2021 年度実績報告書

阿久澤圭東京大学, 工学系研究科, 特別研究員(DC2)