研究概要 |
平成2年度の研究実施計画に沿って研究実績を記述する. (1)パタ-ンマッチングにおける標準パタ-ンの予備選択法の検討…… 音素の認識の前処理として音素的単位セグメンテ-ションを行う場合には,各音素に対応する複数のテンプレ-トを用意することになるが,標準パタ-ン全体のデ-タ量は比較小さくパタ-ンマッチングのための処理量もそれ程多くはないので,特定話者対象の場合にはとくに問題はないことが確かめられた.不特定話者対応とする場合には母音と出現頻度の多い音素についてはテンプレ-トの選択を行い,標準パタ-ンの数を減らすことがシステムの簡単化と処理の高速化に有効であることが確かめられた.母音等の音素標準パタ-ンの数を従来のマルチテンプレ-トの方法に比べ約十分の一にする方法を提案した. (2)今話速度連続音声認識システムの実現と評価…… 本格的システム構成の準備として,大語彙単語音声認識システムを本研究の方式によって構成し,認識実験を行った.セグメンテ-ションに基づいて音素認識を行い,それによって得た音素ラティスと辞書による音素記号別とのマッチングにより単語認識を行うものであるが,1642語の単語辞書に対し,第一修補認識率は96.8%であり,第三修補に正解を含む形の認識率は98.5%である.現在,文章レベルの連続音声中の単語あるいは文節の認識システムを構成し,認識実験を行っている.従来の単語スポッティングと異なり,大語彙の場合にもかなり高い認識率を得ており,しかも処理量が従来の方法に比べ著しく小さい。文章レベルの連続音声に対しては大語彙の基本単語のスポッティングを初めに行い,次に語尾や付属語の認識を行うようにしている.
|