情報処理システムと人間との間で情報の授受を行うとき、音声言語を媒介とすることは、人間にとって最も根源的かつ高速で便利な手段である。本研究では、情報処理システムが音声言語を受理する機能である音声自動認識の高性能化をめざして、遺伝的アルゴリズムを用いた認識モデルの構成方法を確立し、その有効性を実験的に明らかにすることを目的としている。 音声自動認識のためのモデルとしては、音声の生成を確率過程としてとらえる隠れマルコフモデルを用いる方法が現在のところ最も有望である。しかし、この方法では、モデルのパラメータは局所的最適値にとどまり、最適なモデルの構造を決定する効果的なアルゴリズムが確立されていない。そこで本研究では、隠れマルコフモデルの構造を自動的に決定するため、生物の進化過程をモデル化した遺伝的アルゴリズムを応用する。この方法では、世代を経るに従い尤度の低いモデルは淘汰され、より認識率の高いモデルが生き残るので、広域的最適な高性能のモデルを得ることができる。 モデルの構造をコーディングする場合、遺伝的アルゴリズムにおける交差処理で、マルコフモデルの確率的構造を壊さないようにする必要がある。このため、本研究では状態遷移を状態単位でセットにして処理することを提案した。さらに、突然変異で構造が壊れ致死構造となった場合の対処法として、致死構造を捨て、代わりに親のクローンをつくることを検討した。適応度については、先ず、各カテゴリ独立の尤度を利用して進化させた。次に各カテゴリが関連を持って進化するようにカテゴリセットの尤度の和を利用した。以上のことを、離散・連続両マルコフモデルについて検討し、認識実験により、その有効性を示した。
|