情報処理システムと人間との間で情報の授受を行うとき、音声言語を媒介とすることは、人間にとって最も根源的かつ高速で便利な手段である。本研究では、情報処理システムが音声言語を受理する機能である音声自動認識の高性能化をめざして、遺伝的アルゴリズムを用いた認識モデルの構成方法を確立し、その有効性を実験的に明らかにすることを目的としている。 音声自動認識のためのモデルとしては、音声の生成を確率過程としてとらえる隠れマルコフモデルを用いる方法が現在のところ最も有望である。しかし、この方法では、モデルのパラメータは局所的最適値にとどまり、最適なモデルの構造を決定する効果的なアルゴリズムが確立されていない。そこで本研究では、隠れマルコフモデルの構造を自動的に決定するため、生物の進化過程をモデル化した遺伝的アルゴリズムを応用する。この方法では、世代を経るに従い尤度の低いモデルは淘汰され、より認識率の高いモデルが生き残るので、広域的最適な高性能のモデルを得ることができる。 離散型隠れマルコフモデルに遺伝的アルゴリズムを適用する方法は、昨年までにほぼ確立したので、本年度は、より有効なモデルとされる連続型隠れマルコフモデルに遺伝的アルゴリズムを適用し、さらに高性能化を図った。遺伝的アルゴリズムにおける交差及び突然変異処理で、マルコフモデルの確率的構造を壊さないようにするため、状態単位で交差・突然変異を行なうようにアルゴリズムを改良した。さらに、突然変異で構造が壊れ、致死構造となった場合の対処法を提案した。連続型隠れマルコフモデルの適応度については、先ず各カテゴリ独立の尤度を利用し、次に各カテゴリが関連を持つように認識率を利用して進化させることが有効であることを示した。
|