ニューロンネットワークは人間の脳における情報処理の手段と考えられ、その自己組織化・学習能力と相まって従来の手法とは異なる能力を持つ。本研究は音声の認識・理解の過程をニューロンネットワークで実現し、従来の信号処理的な手法では解析困難であった複合的な情報処理を目指したものである。 本年度はニューロンネットワークの持つ、(1)信号-中間表現-認識の全ての過程で共通の情報表現の可能性、(2)認識結果から信号およびその前処理過程へのフィードバックの可能性、を検討するための基礎段階として、実際の音声の分析・特徴抽出システムを作成し、次年度以降の研究の準備とした。 現実に作成したのは、以下のようなシステムである。 1.フレームの音素分類尤度ベクトルの生成 ケプストラムで表現された音声の各フレームを、音素単位で分類してその尤度ベクトルを求める。そのための分類システムにバックプロパゲーションを使用した。 2.誤りを含む音素の認識系列からの単語の認識尤度ベクトルの生成 単語認識は音素の系列から状態遷移で行なわれると考え、単語と音素尤度ベクトルとのマッチングをとる最適経路探索プログラムを開発した。この手法は誤りを含む音素系列からでも状態遷移的に単語の尤度を求めることができる。 以上の研究により、単語間の関係や音素と単語の間の関係を表現するコネクションにより、言語処理と音声処理を複合させたシステムの研究のための準備が整った。
|