1994 Fiscal Year Annual Research Report
リカレントネットワークによる実時間連続音声認識とモデル選択に関する研究
Project/Area Number |
06650401
|
Research Institution | The University of Electro-Communications |
Principal Investigator |
高橋 治久 電気通信大学, 電気通信学部, 助教授 (90135418)
|
Co-Investigator(Kenkyū-buntansha) |
吉田 利信 電気通信大学, 電気通信学部, 助教授 (30114341)
富田 悦次 電気通信大学, 電気通信学部, 教授 (40016598)
|
Keywords | 音声認識 / ニューラルネットワーク / リカレントネットワーク / 学習 |
Research Abstract |
平成6年度は、音声データベース(ATR)を購入し、本実験に適応するよう、ラベリングと音素の切り出しを終了し、ネットワークの本格的学習を開始した.これに先だって、東北-松下音声データベース(少数語彙)で基礎的実験を行い、学習法のパラメータ調整、各種アーキテクチャの検討を初めており、理論的検討とあわせておよそ以下の知見を得ている:1.中間層の動的表現について、電子情報通信学会研究会における議論と指摘に基づいて、矩型波等の単純入力においてセグメンテーションニューロン等の特徴抽出ニューロンができていること追確認した.これによって、連続音声入力で確認された中間層の動作は正しいことが証明された.2.調音結合のある音素データを使って連続音声認識が可能となる理由が明確になった.これらの結果に基づいて、ATR音声データベースにより実験を行ったところ、母音で90%台、子音で80%台後半の認識率が得られた.しかし、tの認識率が極端に低く全体的にデータである音声の切り出しが正確でないこと判明し、引き続き来年度も実験を継続する.また、研究目的のうちの理論的柱である学習の解析に関しては、局所VC次元の理論をリカレントネットワークに適用する前段階として、この概念を連続的関数の学習問題に拡張し、またネットワークの容量について基礎的検討を行った.これらは国際会議NOLTA94で発表された.
|