研究概要 |
本年度の研究では以下のことを行った. 1.HMMに必要な100単語を格文法などを考慮して選定した. これらの言葉は意味の上で, ある世界を表現できるように選び出した. 2.DSP(Digital Signal Processor)を使用して, カットオフ周波数を自由に調節できる装置を作成した. このシステムはプリエンファシスなども自由に調整できる. 3.1で述べた単語の録音を行った. この音声は女5人, 男5人, で一人につき同一単語を4回発声したものを用いた. この内の3回を訓練用, 1回をテスト用データとした. 4.2で述べた装置を通し3の音声をコンピュータに入力した. 5.4で入力したデータを元にLPC係数を求めた. 6.5のデータをベクトル量子化してラベル系列に変換した. 7.6のデータを元にHMMのパラメータを学習により決定した. このモデルにはいくつかの構造の異なるものを用いた. 8.7で得られたモデルを元に100単語の不特定話者の認識を行った. これらの実験より以下のことが確認された. ベクトル量子化の距離尺度としてLPCケプストラムの2乗距離を用い, HMMの状態数を7とし, 最終状態を自己ループしないものが不特定話者の認識率において93.7%を実現した. これからの計画として以下のことを考えている. 1.音声中の雑音の検出及び除去 2.連続音声認識への移行
|