研究概要 |
本研究は、多数のカテゴリを学習・識別するニュ-ラルネットとして提案しているCombNETーIIを基本的なネットワ-クモデルとして用い、その学習能力、認識能力、汎化能力などの諸性能について検討するものである。本年度は、CombNETーIIのパタ-ン識別能力を検証するため、JIS第1,2水準の印刷漢字(6349文字)デ-タを識別する実験を行なった。このようにして構築されたCombNETーIIを用いてJIS第1,2水準印刷漢字6349文字の識別実験を行なったところ99.8%前後という高い識別率が得られた。さらに、マルチフォント印刷漢字の認識実験も行なったところ、字形の違いに対してStemーNetworkニュ-ロンの増加によって適応的に対応するネットワ-クを構成することができた。次に、手書き英数字の認識実験を行なった。今回、電総研から提供されている文字デ-タベ-スETL6に含まれている手書き英数字を識別対象に実験を行なった。その結果、600人分のデ-タを学習したときに、未知デ-タに対する認識率が99.0%に達した。CombNETーIIは、このように個々のデ-タの変動にも柔軟に対処することのできるネットワ-クとなっていることを示した。さらに、CombNETーIIによる単語音声認識を行いその有効性を検討した。特徴パラメ-タには音声の周波数変化と時間変化を同時に表すことのできる2次元メルケプストラムを用いた。まず、特定話者による1000単語の認識実験を行なったところ、最高認識率は99.0%となった。また、20人の話者による100単語の認識実験を行なったところ、やはり99.0%もの高い認識率を得た。以上、CombNETーIIが分類カテゴリ数の多いパタ-ン認識の識別関数の学習方式として、単純な階層型ニュ-ラルネットワ-クの限界を超える能力をもっていることを明らかにした。
|