情報処理システムと人間との間で情報の授受を行うとき、音声言語を媒介とすることは、人間にとって最も根源的かつ高速で便利な手段である。本研究では、情報処理システムが音声言語を受理する機能である音声自動認識の高性能化をめざして、遺伝的アルゴリズムを用いた認識モデルの構成方法を確立し、その有効性を実験的に明らかにすることを目的としている。 音声自動認識のためのモデルとしては、音声の生成を確率過程としてとらえる隠れマルコフモデル(HMM)を用いる方法が現在のところ最も有望である。しかし、この方法では、最適なモデルの構造を決定する効果的なアルゴリズムが確立されていない。 そこで本研究では、HMMの構造を自動的に決定するため、生物の進化過程をモデル化した遺伝的アルゴリズム(GA)を応用する方法を提案している。この方法では、世代を経るに従い尤度の低いモデルは淘汰され、より認識率の高いモデルが生き残るので、広域的最適な高性能のモデルを得ることができる。 まず単語音声認識のための離散型HMMの構造決定にGAを適用した。認識実験の結果、クローズ実験だけでなくオープン実験においても、世代を経るに従い認識率の高い構造が得られることが示された。認識率は、通常よく使われ性能も高いLeft-Right構造よりも高くなり、GAの有効性が示された。次に、連続型HMMにGAを適用し、離散型HMMと同様に有効な結果が得られることを示した。さらに、この方法の改良法として、語彙単語をセットにした符号化、隠れ遺伝子、及び状態単位での交叉・突然変異が有効であることを示した。
|