本研究では,複数のパターン認識システムを協調的に最適化しながら,システム全体を効率的かつ自動で成長させる方式を開発した.平成27年度は前年度に引き続き,システムの使用者や使用環境の違いにより生じるデータの変動に対して,システムを適応的に改善するための要素技術について主に検討を行った. 【27-1】ニューラルネットワークに基づく識別器の不確かさを推定する技術の開発:深層ニューラルネットワークに基づくパターン認識システムが出力する認識結果の不確かさを推定する方式について検討を行った.特に本年度は,深層の自己符号化器の復元誤差を用いた推定方式に焦点を当てて検討を行い,マルチストリーム型パターン認識システム(【27-2】)における入力データに応じたシステムの適応的な選択や,雑音抑圧のためのフィルタの推定などに用いた.ここで開発した技術は,電気機器や人の睡眠における異常状態の検出等にも応用していく予定である. 【27-2】マルチストリーム型パターン認識による環境変動に頑健な教師なし適応技術の開発:異なる現象を扱うパターン認識システムを深層学習により多数構築しておき,最適なシステムを入力データの性質に応じて選択的に用いることで,環境の変化や未知環境に対して頑健に高い性能を与える認識方式を開発し,音声認識に焦点を当て評価を行った.異なる雑音環境ごとに構築したシステムを【27-1】で開発した技術により選択的に用いたところ,入力データに最も性質が類似する雑音環境に対するシステムを適切に選択でき,かつ音声認識において一般的に用いられるマルチスタイル学習(様々な雑音下音声を用いた単一システムの構築)の性能を著しく上回ることを明らかにした.また,異なる音響特徴ごとに構築したシステムを選択的に用いることで,雑音や残響といったより広範な音響環境の違いに対しても頑健に高い性能を与えることがわかった.
|