1997 Fiscal Year Annual Research Report
新しい構造を持つニューラルネットワークを用いた音声認識における諸問題の検討
Project/Area Number |
09750441
|
Research Institution | Kushiro National College of Technology |
Principal Investigator |
大槻 典行 釧路工業高等専門学校, 情報工学科, 助教授 (30141857)
|
Keywords | ニュートラルネットワーク / 音声認識 / 自己組織化 / 適応信号処理 |
Research Abstract |
本研究室で開発した新しい構造を持つニューラルネットワークを用いた音声認識における諸問題を検討した.この音声認識手法で検討すべき項目は“日本語全音素に反応すること",“話者の依存性に関すること",“音声の経年変化について調査すること"である.この音声認識手法は時間的に変化しやすい音素に対して高い認識率を得ることは既に示されているが,全ての音素に対して充分な認識率が得られることはまだ示されていなかった.そこで本年度は日本語の全音素を対象に認識実験・調査を行い日本語音声を充分な認識率で認識可能となるような手法にした.全音素の認識に対応するには,全音素をいくつかのグループに分けグループ毎に音声の認識窓長を適正な長さに設定することで高い認識率を得ることができることがわかった.次に,話者の依存性に関してはこれまで1名の話者で認識率を得ていたが,本年度は1名を加えた.この状態でも高い認識率が得られた.次年度は更に多くの話者を加え,充分な人数の話者を使い認識実験・調査を行い不特定話者の音声認識が可能になるようにする. この音声認識手法に適応信号処理とニュートラルネットワークの入力層に自己組織化層を用いているので,これらが高い認識率を得る要因になっているという結論も得られている。 最後に、従来の音声認識手法では音声の経年変化について充分に考慮されていなかった点については,音声を定期的にサンプルして保管している.これらの音声データを使って次年度は音声の経年変化が音声認識に与える影響を調査する.この結果を踏まえて音声の経年変化に対しても高い認識率を得る手法を検討する.
|