2012 Fiscal Year Annual Research Report
クラスタリングと教師なし適応学習に基づく時系列パターン認識システムの効率的な改善
Project/Area Number |
23700218
|
Research Institution | Waseda University |
Principal Investigator |
小川 哲司 早稲田大学, 理工学術院, 准教授 (70386598)
|
Keywords | クラスタリング / ベイズ学習 / 教師なし学習 / 音環境理解 / パターン認識 |
Research Abstract |
本研究では,音声データの構造化・検索支援のための基幹技術として,音声データを発話者や雑音といった音環境ごとにクラスタリングする技術と音声認識システムを教師なしの枠組みで改善する(日々成長させる)技術の開発を行った. 主な研究成果は以下の通りである.このうち平成24年度は,【24-1】音環境クラスタリングの改良と,【24-2】雑音に頑健なデータドリブン型音声認識システムの開発を行った. 【成果1】環境変動に頑健な音環境クラスタリング:【23-1】データに応じてクラスタ数とモデルパラメータを同時に最適化可能な話者モデリングとして,セグメント単位ディレクレ過程混合モデルを提案した.特に平成24年度は,【24-1】サンプリング手法の高精度化について詳細な検討を行い,データの量および質(雑音など)の変動に対して頑健に高いクラスタリング精度を達成した.また,【23-2】発話内に複数話者が混在する場合に対して頑健な方式として,i-vectorを話者表現として用いた非負値行列分解に基づく話者クラスタリングを開発し,データ量の変動に対して頑健な性能を達成した. 【成果2】クラスタリング結果を用いた確率モデルの適応学習システムの開発:【23-3】[成果1]で得られたクラスタリング結果に基づいて,音声認識に用いる確率モデル(音響モデル)を教師なしの枠組みで改善する方式について検討を行い,プロトタイプシステムを開発した. 【成果3】データドリブン型マルチストリーム音声認識システムの開発:【24-2】音声認識性能を予測しながら,各時刻において良好な性能を与える音声認識システムを選択・統合することで,雑音の変動に対して頑健に高い性能を与える音声認識方式を開発した.[成果1,2]と本成果と統合することで,雑音変動に頑健であり,かつ日々得られるデータを用いて自動改善可能な音声認識システムの実現が期待できる.
|
Research Products
(7 results)