ベイズ二重分節解析器と深層学習の統合モデルの開発と推論手法の高速化に取り組んだ.具体的には下記の4点の研究に取り組んだ. 1.ベイズ二重分節解析器のサンプリングアルゴリズムの高速化:本研究で提案しているベイズ二重分節解析器(Nonparametric Bayesian Double Articulation Analyzer: NPB-DAA)は二重分節構造を持つ時系列データのための確率的生成モデルとしてHDP-HLM(Hierarchical Dirichlet process-hidden language model)を基礎としている.その推論手法としてブロック化ギブスサンプリングに基づく方法が確立しているが,実時間比100倍程度という実行速度の遅さが問題となっていた.基礎的なアルゴリズムを維持したまま,メモ化の理論的導入により10倍の高速化を果たし,実時間比10倍程度まで高速化した.この内容は国際会議にて報告予定である. 2.ベイズ二重分節解析器と深層学習の確率的生成モデルとしての統合モデルの開発:変分オートエンコーダと混合モデルを結合したモデルに関するモデルを開発した. 3.限られた語彙を用いた単一話者の自然な音声発話からの教師なし言語獲得:前年度に提案したNPB-DAA with DSAE (Deep Sparse Auto Encoder)を子音を含んだ英語音声データに適用し,その有効性を検証した.具体的にはTIDIGITSコーパスと呼ばれる数字の読み上げ音声データに適用し,その有効性を検証した.また,DSAEのネットワーク構造に関して比較研究を行い国際会議にて報告を行った. 4. 複数話者・大規模音声発話データからの教師なし言語獲得の実現:複数話者の話者依存性を吸収する手法に関して研究を行った.
|