2016 年度実績報告書

ベイズ二重分節解析と深層学習の統合による教師なし言語獲得の構成論

研究課題

研究課題/領域番号	15H05319
研究機関	立命館大学
研究代表者	谷口忠大立命館大学, 情報理工学部, 准教授 (80512251)
研究期間 (年度)	2015-04-01 – 2019-03-31
キーワード	言語獲得 / ノンパラメトリックベイズ / 深層学習 / 音声認識 / 記号創発
研究実績の概要	初年度の研究課題として，ベイズ二重分節解析器と深層学習の統合モデルの開発と推論手法の高速化に取り組んだ．具体的には下記の３点の研究に取り組んだ．１．階層ディリクレ過程隠れ言語モデルへの変分ベイズ法の適用に関する研究：本研究で提案しているベイズ二重分節解析器（Nonparametric Bayesian Double Articulation Analyzer: NPB-DAA）は二重分節構造を持つ時系列データのための確率的生成モデルとしてHDP-HLM(Hierarchical Dirichlet process-hidden language model)を基礎としている．その推論手法はこれまでギブスサンプリングに基づく方法が用いられていたが，高速化のために変分ベイズ法に基づく推論手法を導出した．また，この変分推論に確率的勾配法を適用し，より大規模なデータに対する適用可能性を検討した．その有効性に関しては今後の検証課題である．２．ベイズ二重分節解析器と深層学習の確率的生成モデルとしての統合モデルの開発：深層学習のモデルを確率的生成モデルとしてとらえ，これをHDP-HLMと統合し，推論手法を導出するための基礎的検討を行った．具体的には変分オートエンコーダと混合モデルを結合したモデルに関する研究を進めた．３．限られた語彙を用いた単一話者の自然な音声発話からの教師なし言語獲得：前年度に提案したNPB-DAA with DSAE (Deep Sparse Auto Encoder)を子音を含んだ英語音声データに適用し，その有効性を検証した．具体的にはTIDIGITSコーパスと呼ばれる数字の読み上げ音声データに適用し，その有効性を検証した．また，DSAEのネットワーク構造に関して比較研究を行った．この内容に関しては国際会議において発表の予定である．
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由初年度に当初の予定以上の進展を得たが，その成果を踏まえながら，二年度目ではその成果の応用可能性に関する探索的研究と，モデルを理論的にさらに発展させるための理論的研究，及びそのための調査を中心的に行った．多くの議論の発展や，実験的結果に基づく知見を得ることができた．
今後の研究の推進方策	二年間で研究計画書に示した，1.ベイズ二重分節解析器と深層学習の統合モデルの開発，2. ベイズ二重分節解析器のサンプリングアルゴリズムの高速化，3. 限られた語彙を用いた単一話者の自然な音声発話からの教師なし言語獲得の実現に関して，一定の進捗を得ることが出来た．これらの内容に関しても，さらに理論的な発展を得るとともに，4. 環境・文脈の情報を用いた教師なし言語獲得の高精度化，5. 複数話者・大規模音声発話データからの教師なし言語獲得の実現，といった課題に関して研究を進めていく．

研究成果
(5件)

すべて 2016 その他

すべて学会発表 (3件) (うち国際学会 1件) 備考 (2件)

[学会発表] Hierarchical Dirichlet Process-Hidden Language Model for Unsupervised Word Discovery from Speech Signals2016
- 著者名/発表者名
  Tadahiro Taniguchi, Kaede Hayashi, Ryo Nakashima and Shogo Nagasaka
- 学会等名
  Practical Bayesian Nonparametrics workshop at NIPS 2016
- 発表場所
  Barcelona (Spain)
- 年月日
  2016-12-09
- 国際学会
[学会発表] 階層ディリクレ過程隠れ言語モデルと深層学習を用いた語彙獲得過程の計算論2016
- 著者名/発表者名
  林楓，中島諒，長坂翔吾，谷口忠大
- 学会等名
  日本認知科学会第33回大会
- 発表場所
  北海道大学（北海道・札幌市）
- 年月日
  2016-09-17
[学会発表] 階層ディリクレ過程隠れ言語モデルへの変分ベイズ法の適用2016
- 著者名/発表者名
  林楓，高野敏明，萩原良信，谷口忠大
- 学会等名
  2016年度人工知能学会全国大会,
- 発表場所
  北九州国際会議場（福岡県・北九州市）
- 年月日
  2016-06-07
[備考] 創発システム研究室　研究業績
- URL
  http://www.em.ci.ritsumei.ac.jp/publication
[備考] Double Articulation Analyzer (二重分節解析器)
- URL
  http://daa.tanichu.com/

2016 年度 実績報告書

ベイズ二重分節解析と深層学習の統合による教師なし言語獲得の構成論

研究代表者

谷口 忠大 立命館大学, 情報理工学部, 准教授 (80512251)

現在までの達成度 (区分)

理由

研究成果

[学会発表] Hierarchical Dirichlet Process-Hidden Language Model for Unsupervised Word Discovery from Speech Signals2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 階層ディリクレ過程隠れ言語モデルと 深層学習を用いた語彙獲得過程の計算論2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 階層ディリクレ過程隠れ言語モデルへの変分ベイズ法の適用2016

著者名/発表者名

学会等名

発表場所

年月日

[備考] 創発システム研究室 研究業績

URL

[備考] Double Articulation Analyzer (二重分節解析器)

URL

2016 年度実績報告書

谷口忠大立命館大学, 情報理工学部, 准教授 (80512251)

[学会発表] 階層ディリクレ過程隠れ言語モデルと深層学習を用いた語彙獲得過程の計算論2016

[備考] 創発システム研究室　研究業績