2021 Fiscal Year Annual Research Report

モデルベース強化学習のための変分自己符号化器を用いた系列モデルの開発

Research Project

Project/Area Number	20J11448
Research Institution	The University of Tokyo
Principal Investigator	阿久澤圭東京大学, 工学系研究科, 特別研究員(DC2)
Project Period (FY)	2020-04-24 – 2022-03-31
Keywords	深層学習 / 強化学習 / 生成モデル / 深層系列モデル / 系列モデル / 自然言語処理 / 音声信号処理
Outline of Annual Research Achievements	本研究は過去の観測系列を圧縮して大域的な表現を推論することができる深層系列生成モデルの開発を行い，それをモデルベース強化学習に応用することを目指すものである．本年度は，昨年度に投稿または採録された二つの研究について学会誌への採録や国際学会での発表を行うとともに，新たに二つの研究課題に取り組んだ（a, b）． (a) 視覚と言語の対応づけのための軌道の大域表現の半教師あり学習：昨年度から取り組んでいる内容について国内学会での発表を行うともに，それを発展させた研究について国際学会への投稿を行なった．研究内容としては，エージェントの軌道（画像と行動の系列）が与えられたときに，その軌道とそれを記述する言語指示の対応づけを学習する手法の開発を行うものである．提案手法は，言語指示が軌道の大域的な表現とみなすことができるという性質を利用し，深層系列生成モデルを用いた大域表現学習を補助タスクとして利用する．加えて，軌道と自然言語という二つのモダリティおよび系列長が異なるデータの潜在表現を学習するのに適した，新たなニューラルネットアーキテクチャを提案した． (b) 階層型深層生成モデルを利用した音声変換：本年度から新たに取り組んだ研究が国際学会に採択され，また同国際学会で発表を行なった．研究(a)に示唆されるように，系列の大域的な表現はモデルベース強化学習において役立つ可能性がある．本研究は，系列の大域的な表現の学習を改善するための新たなアプローチの検討と位置付けることができる．本研究はRate-Distortion分析により，表現が特定の情報に対して不変でありかつ生成モデルとしての尤度を高く保つためにはモデルの表現力が十分大きい必要があることを確認した．そして音声変換のタスクで実験を行い，高いモデル表現力を持つ階層型深層生成モデルは表現の不変性と尤度を高い水準で両立できることを示した．
Research Progress Status	令和3年度が最終年度であるため、記入しない。
Strategy for Future Research Activity	令和3年度が最終年度であるため、記入しない。

Research Products
(5 results)

All 2021

All Journal Article (1 results) (of which Peer Reviewed: 1 results, Open Access: 1 results) Presentation (4 results) (of which Int'l Joint Research: 3 results)

[Journal Article] Information-theoretic regularization for learning global features by sequential VAE2021
- Author(s)
  Akuzawa Kei、Iwasawa Yusuke、Matsuo Yutaka
- Journal Title
  
  Machine Learning
  
  Volume: 110 Pages: 2239～2266
- DOI
  10.1007/s10994-021-06032-4
- Peer Reviewed / Open Access
[Presentation] ナビゲーション課題における視覚と言語の対応づけのための軌道の大域表現の半教師あり学習2021
- Author(s)
  阿久澤圭，岩澤有祐，松尾豊
- Organizer
  人工知能学会全国大会（第35回）
[Presentation] Estimating Disentangled Belief about Hidden State and Hidden Task for Meta-Reinforcement Learning2021
- Author(s)
  Kei Akuzawa 、Yusuke Iwasawa、Yutaka Matsuo
- Organizer
  the Third Learning for Dynamics and Control (L4DC) Conference
- Int'l Joint Research
[Presentation] Information-theoretic regularization for learning global features by sequential VAE2021
- Author(s)
  Kei Akuzawa 、Yusuke Iwasawa、Yutaka Matsuo
- Organizer
  the European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases
- Int'l Joint Research
[Presentation] Conditional Deep Hierarchical Variational Autoencoder for Voice Conversion2021
- Author(s)
  Kei Akuzawa, Kotaro Onishi, Keisuke Takiguchi, Kohki Mametani, Koichiro Mori
- Organizer
  13th Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC)
- Int'l Joint Research

2021 Fiscal Year Annual Research Report

モデルベース強化学習のための変分自己符号化器を用いた系列モデルの開発

Principal Investigator

阿久澤 圭 東京大学, 工学系研究科, 特別研究員(DC2)

Research Products

[Journal Article] Information-theoretic regularization for learning global features by sequential VAE2021

Author(s)

Journal Title

DOI

[Presentation] ナビゲーション課題における視覚と言語の対応づけのための軌道の大域表現の半教師あり学習2021

Author(s)

Organizer

[Presentation] Estimating Disentangled Belief about Hidden State and Hidden Task for Meta-Reinforcement Learning2021

Author(s)

Organizer

[Presentation] Information-theoretic regularization for learning global features by sequential VAE2021

Author(s)

Organizer

[Presentation] Conditional Deep Hierarchical Variational Autoencoder for Voice Conversion2021

Author(s)

Organizer

阿久澤圭東京大学, 工学系研究科, 特別研究員(DC2)