2019 Fiscal Year Annual Research Report
Constraint Free Training of Speech Recognition Systems Based on Full Bayes Modeling
Project/Area Number |
17K20001
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
篠崎 隆宏 東京工業大学, 工学院, 准教授 (80447903)
|
Co-Investigator(Kenkyū-buntansha) |
持橋 大地 統計数理研究所, 数理・推論研究系, 准教授 (80418508)
|
Project Period (FY) |
2017-06-30 – 2020-03-31
|
Keywords | 音声認識 / 教師なし学習 / 強化学習 |
Outline of Annual Research Achievements |
音声認識を様々なタスクにおいて実用的なものとするためには、認識システムの学習において教師あり学習への依存度を減らし、システムをより自律的なものへとする必要がある。本研究では、ノンパラメトリックベイズ法と重み付き有限トランスデューサ技術を応用し、対応の無い音素データとテキストデータから、自動的に発音辞書を拡張する手法を提案した。また、書き起こしテキストを用いずにEncoder-Decoder型の音声認識システム全体を方策関数として、認識結果のスカラー評価値をもとにシステムを強化学習する方法について検討および実験を進めた。これは、クラウド上に構築された音声認識サーバーが多数のユーザーに認識サービスを提供する際に、ユーザーからのわずかなフィードバックを大量に集めることで、書き起こしを用いることなくシステム性能を向上させる応用を想定したものである。 本年度においては、End-to-End型の音声認識システムを強化学習する際の学習効率の向上や、教師なし学習により得た音声単語辞書をもとに対話試行を通して音声言語を自動獲得するシステムについて研究を行った。End-to-End型の音声認識システムの強化学習では学習効率を大幅に向上させる手法を提案し、昨年度よりもより一般的なネットワーク構造のモデルを対象にしつつ効率的に学習させられることを示した。音声言語獲得では、提案学習アルゴリズムを仮想的な学習ロボットに実装した。ラベルの無い連続発話音声を学習データとして用いたシミュレーション実験において、ロボットが効率的にコマンド発声を獲得することを示した。
|
Research Products
(11 results)