• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

モデルベース強化学習のための変分自己符号化器を用いた系列モデルの開発

Research Project

Project/Area Number 20J11448
Research Category

Grant-in-Aid for JSPS Fellows

Allocation TypeSingle-year Grants
Section国内
Review Section Basic Section 61030:Intelligent informatics-related
Research InstitutionThe University of Tokyo

Principal Investigator

阿久澤 圭  東京大学, 工学系研究科, 特別研究員(DC2)

Project Period (FY) 2020-04-24 – 2022-03-31
Project Status Completed (Fiscal Year 2021)
Budget Amount *help
¥1,700,000 (Direct Cost: ¥1,700,000)
Fiscal Year 2021: ¥800,000 (Direct Cost: ¥800,000)
Fiscal Year 2020: ¥900,000 (Direct Cost: ¥900,000)
Keywords深層学習 / 強化学習 / 生成モデル / 深層系列モデル / 系列モデル / 自然言語処理 / 音声信号処理
Outline of Research at the Start

本研究では,モデルベース強化学習のための変分自己符号化器(Variational Autoencoder, VAE)を用いた系列モデルの開発を行う.具体的には,系列データが持つ現実の構造である階層性をモデリングすることができるVAEを用いた系列モデルを開発すること,そしてこの技術を用いて動画などの高次元データから適切な階層的表現を抽出しモデルベース強化学習に用いることで,環境変化にロバストな自律的行動を可能とする手法を開発することを目的としている.

Outline of Annual Research Achievements

本研究は過去の観測系列を圧縮して大域的な表現を推論することができる深層系列生成モデルの開発を行い,それをモデルベース強化学習に応用することを目指すものである.本年度は,昨年度に投稿または採録された二つの研究について学会誌への採録や国際学会での発表を行うとともに,新たに二つの研究課題に取り組んだ(a, b).
(a) 視覚と言語の対応づけのための 軌道の大域表現の半教師あり学習:昨年度から取り組んでいる内容について国内学会での発表を行うともに,それを発展させた研究について国際学会への投稿を行なった.研究内容としては,エージェントの軌道(画像と行動の系列)が与えられたときに,その軌道とそれを記述する言語指示の対応づけを学習する手法の開発を行うものである.提案手法は,言語指示が軌道の大域的な表現とみなすことができるという性質を利用し,深層系列生成モデルを用いた大域表現学習を補助タスクとして利用する.加えて,軌道と自然言語という二つのモダリティおよび系列長が異なるデータの潜在表現を学習するのに適した,新たなニューラルネットアーキテクチャを提案した.
(b) 階層型深層生成モデルを利用した音声変換:本年度から新たに取り組んだ研究が国際学会に採択され,また同国際学会で発表を行なった.研究(a)に示唆されるように,系列の大域的な表現はモデルベース強化学習において役立つ可能性がある.本研究は,系列の大域的な表現の学習を改善するための新たなアプローチの検討と位置付けることができる.本研究はRate-Distortion分析により,表現が特定の情報に対して不変でありかつ生成モデルとしての尤度を高く保つためにはモデルの表現力が十分大きい必要があることを確認した.そして音声変換のタスクで実験を行い,高いモデル表現力を持つ階層型深層生成モデルは表現の不変性と尤度を高い水準で両立できることを示した.

Research Progress Status

令和3年度が最終年度であるため、記入しない。

Strategy for Future Research Activity

令和3年度が最終年度であるため、記入しない。

Report

(2 results)
  • 2021 Annual Research Report
  • 2020 Annual Research Report
  • Research Products

    (9 results)

All 2021 2020

All Journal Article (2 results) (of which Peer Reviewed: 2 results,  Open Access: 2 results) Presentation (7 results) (of which Int'l Joint Research: 5 results)

  • [Journal Article] Information-theoretic regularization for learning global features by sequential VAE2021

    • Author(s)
      Akuzawa Kei、Iwasawa Yusuke、Matsuo Yutaka
    • Journal Title

      Machine Learning

      Volume: 110 Issue: 8 Pages: 2239-2266

    • DOI

      10.1007/s10994-021-06032-4

    • Related Report
      2021 Annual Research Report
    • Peer Reviewed / Open Access
  • [Journal Article] Joint Adversarial Training of Speech Recognition and Synthesis Models for Many-to-One Voice Conversion Using Phonetic Posteriorgrams2020

    • Author(s)
      SAITO Yuki、AKUZAWA Kei、TACHIBANA Kentaro
    • Journal Title

      IEICE Transactions on Information and Systems

      Volume: E103.D Issue: 9 Pages: 1978-1987

    • DOI

      10.1587/transinf.2019EDP7297

    • NAID

      130007894624

    • ISSN
      0916-8532, 1745-1361
    • Year and Date
      2020-09-01
    • Related Report
      2020 Annual Research Report
    • Peer Reviewed / Open Access
  • [Presentation] ナビゲーション課題における視覚と言語の対応づけのための軌道の大域表現の半教師あり学習2021

    • Author(s)
      阿久澤圭,岩澤有祐,松尾豊
    • Organizer
      人工知能学会全国大会(第35回)
    • Related Report
      2021 Annual Research Report
  • [Presentation] Estimating Disentangled Belief about Hidden State and Hidden Task for Meta-Reinforcement Learning2021

    • Author(s)
      Kei Akuzawa 、Yusuke Iwasawa、Yutaka Matsuo
    • Organizer
      the Third Learning for Dynamics and Control (L4DC) Conference
    • Related Report
      2021 Annual Research Report
    • Int'l Joint Research
  • [Presentation] Information-theoretic regularization for learning global features by sequential VAE2021

    • Author(s)
      Kei Akuzawa 、Yusuke Iwasawa、Yutaka Matsuo
    • Organizer
      the European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases
    • Related Report
      2021 Annual Research Report
    • Int'l Joint Research
  • [Presentation] Conditional Deep Hierarchical Variational Autoencoder for Voice Conversion2021

    • Author(s)
      Kei Akuzawa, Kotaro Onishi, Keisuke Takiguchi, Kohki Mametani, Koichiro Mori
    • Organizer
      13th Asia Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC)
    • Related Report
      2021 Annual Research Report
    • Int'l Joint Research
  • [Presentation] Stabilizing Adversarial Invariance Induction from Divergence Minimization Perspective2020

    • Author(s)
      Yusuke Iwasawa, Kei Akuzawa, Yutaka Matsuo.
    • Organizer
      In Proc. of the Twenty-Ninth International Joint Conference on Artificial Intelligence (IJCAI)
    • Related Report
      2020 Annual Research Report
    • Int'l Joint Research
  • [Presentation] Estimating Disentangled Belief about Hidden State and Hidden Task for Meta-Reinforcement Learning.2020

    • Author(s)
      Kei Akuzawa, Yusuke Iwasawa, Yutaka Matsuo.
    • Organizer
      In Proc. of the Third Learning for Dynamics and Control (L4DC) Conference
    • Related Report
      2020 Annual Research Report
    • Int'l Joint Research
  • [Presentation] Posterior Collapseの情報識別可能性による解釈と条件付き相互情報量最大化を用いた対策2020

    • Author(s)
      阿久澤圭,岩澤有祐,松尾豊
    • Organizer
      人工知能学会全国大会(第34回)
    • Related Report
      2020 Annual Research Report

URL: 

Published: 2020-07-07   Modified: 2024-03-26  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi