• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2016 Fiscal Year Annual Research Report

Unsupervised Language Acquisition Integrating Bayesian Double Articulation Analyzer and Deep Learning

Research Project

Project/Area Number 15H05319
Research InstitutionRitsumeikan University

Principal Investigator

谷口 忠大  立命館大学, 情報理工学部, 准教授 (80512251)

Project Period (FY) 2015-04-01 – 2019-03-31
Keywords言語獲得 / ノンパラメトリックベイズ / 深層学習 / 音声認識 / 記号創発
Outline of Annual Research Achievements

初年度の研究課題として,ベイズ二重分節解析器と深層学習の統合モデルの開発と推論手法の高速化に取り組んだ.具体的には下記の3点の研究に取り組んだ.
1.階層ディリクレ過程隠れ言語モデルへの変分ベイズ法の適用に関する研究:本研究で提案しているベイズ二重分節解析器(Nonparametric Bayesian Double Articulation Analyzer: NPB-DAA)は二重分節構造を持つ時系列データのための確率的生成モデルとしてHDP-HLM(Hierarchical Dirichlet process-hidden language model)を基礎としている.その推論手法はこれまでギブスサンプリングに基づく方法が用いられていたが,高速化のために変分ベイズ法に基づく推論手法を導出した.また,この変分推論に確率的勾配法を適用し,より大規模なデータに対する適用可能性を検討した.その有効性に関しては今後の検証課題である.
2.ベイズ二重分節解析器と深層学習の確率的生成モデルとしての統合モデルの開発:深層学習のモデルを確率的生成モデルとしてとらえ,これをHDP-HLMと統合し,推論手法を導出するための基礎的検討を行った.具体的には変分オートエンコーダと混合モデルを結合したモデルに関する研究を進めた.
3.限られた語彙を用いた単一話者の自然な音声発話からの教師なし言語獲得:前年度に提案したNPB-DAA with DSAE (Deep Sparse Auto Encoder)を子音を含んだ英語音声データに適用し,その有効性を検証した.具体的にはTIDIGITSコーパスと呼ばれる数字の読み上げ音声データに適用し,その有効性を検証した.また,DSAEのネットワーク構造に関して比較研究を行った.この内容に関しては国際会議において発表の予定である.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

初年度に当初の予定以上の進展を得たが,その成果を踏まえながら,二年度目ではその成果の応用可能性に関する探索的研究と,モデルを理論的にさらに発展させるための理論的研究,及びそのための調査を中心的に行った.多くの議論の発展や,実験的結果に基づく知見を得ることができた.

Strategy for Future Research Activity

二年間で研究計画書に示した,1.ベイズ二重分節解析器と深層学習の統合モデルの開発,2. ベイズ二重分節解析器のサンプリングアルゴリズムの高速化,3. 限られた語彙を用いた単一話者の自然な音声発話からの教師なし言語獲得の実現に関して,一定の進捗を得ることが出来た.これらの内容に関しても,さらに理論的な発展を得るとともに,4. 環境・文脈の情報を用いた教師なし言語獲得の高精度化,5. 複数話者・大規模音声発話データからの教師なし言語獲得の実現,といった課題に関して研究を進めていく.

  • Research Products

    (5 results)

All 2016 Other

All Presentation (3 results) (of which Int'l Joint Research: 1 results) Remarks (2 results)

  • [Presentation] Hierarchical Dirichlet Process-Hidden Language Model for Unsupervised Word Discovery from Speech Signals2016

    • Author(s)
      Tadahiro Taniguchi, Kaede Hayashi, Ryo Nakashima and Shogo Nagasaka
    • Organizer
      Practical Bayesian Nonparametrics workshop at NIPS 2016
    • Place of Presentation
      Barcelona (Spain)
    • Year and Date
      2016-12-09
    • Int'l Joint Research
  • [Presentation] 階層ディリクレ過程隠れ言語モデルと 深層学習を用いた語彙獲得過程の計算論2016

    • Author(s)
      林楓,中島諒,長坂翔吾,谷口忠大
    • Organizer
      日本認知科学会第33回大会
    • Place of Presentation
      北海道大学(北海道・札幌市)
    • Year and Date
      2016-09-17
  • [Presentation] 階層ディリクレ過程隠れ言語モデルへの変分ベイズ法の適用2016

    • Author(s)
      林楓,高野敏明,萩原良信,谷口忠大
    • Organizer
      2016年度人工知能学会全国大会,
    • Place of Presentation
      北九州国際会議場(福岡県・北九州市)
    • Year and Date
      2016-06-07
  • [Remarks] 創発システム研究室 研究業績

    • URL

      http://www.em.ci.ritsumei.ac.jp/publication

  • [Remarks] Double Articulation Analyzer (二重分節解析器)

    • URL

      http://daa.tanichu.com/

URL: 

Published: 2018-01-16  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi