本研究者は連続音声認識に対して知識工学的手法を導入すると共に、その知識ベースの構築を支援する環境を開発してきた。本研究の最終目的はこれまでの本研究者の成果を更に進めて、知識工学的手法を連続音声認識の新しい手法として確立することにある。本年度(63年度)は、帰納推論に基づく音声データからの認識知識の学習法を開発した。 (1)概要:具体的には、学習用音声データから、音韻認識のための決定木を生成する手法の開発を行った。特に、雑音や学習データの不足に対処するための新しい属性の生成機能及び決定木の一般化操作の開発を重視して研究を進めた。 (2)新しい属性の生成:ここでは予め与えられた基本的な属性を組み合わせることによって適切な概念レベルの強力な属性を生成する方法を開発した。まず、初期の学習によって得られた決定木を解析することによって、分類が困難であった音韻の組を検出する。次に、それらを分類するために必要な部分決定木を生成する。 (3)決定木の一般化法:生成された決定木、及び新属性としての部分木は、そのままでは未知の音声データに対してはうまく動作するとは限らない。特にサンプルが少数であることによる決定木の偏りを修正するためには適切な一般化操作を行うことが必要である。そこで、ノードに属するサンプルの数や属性の値によって一般化をするオペレータを開発した。 (4)評価:学習により生成された知識ベースによる認識を実際に行うことによって、人手によって構成された知識ベースの性能と比較した結果、前者が88%で後者が82%である、かなり優れた性能を持つことを確認すると共に、属性生成の効果と一般化の効果が大きいことが確かめられた。
|