研究課題/領域番号 |
61550261
|
研究種目 |
一般研究(C)
|
配分区分 | 補助金 |
研究分野 |
情報工学
|
研究機関 | 豊橋技術科学大学 |
研究代表者 |
中川 聖一 豊橋技科大, 工学部, 助教授 (20115893)
|
研究期間 (年度) |
1986
|
研究課題ステータス |
完了 (1986年度)
|
配分額 *注記 |
1,300千円 (直接経費: 1,300千円)
1986年度: 1,300千円 (直接経費: 1,300千円)
|
キーワード | 音声認識 / 不特定話者 / 統計的手法 / 単語音声認識 |
研究概要 |
大語彙単語音声認識では、標準パターンの記憶量や認識処理量の増大、さらには登録用パターンの発声の負担等が問題となり、単語単位の標準パターンとの照合による方法は非常に困難となる。一方、音韻や音節を認識の単位とする方法が有効と考えられるが、セグメンテーションという非常に難しい問題を解決しなければならず、又音韻系列や音節系列からの単語への変換も容易ではない。そこで、音節パターン等を連結して単語標準パターンを構成し単語単位の認識アルゴリズムを採用する方法が試みられている。しかし、計算量は単語単位の認識法と同等であり改良を要した。 これらの問題を解決する一つとして、研究代表者は、LESS COST法の研究を行なってきた。しかし、それは孤立発声された単音節を連結して単語標準パターンとして用いたため、調音結合の影響を受けた単語中の音節パターンと異なるため認識率の低下を生じた。そこで、今年度、大語彙音声認識の基礎として、単語中から音節を抽出し標準パターンを抽出した。 通常、単語中からの音節抽出は、波形・スペクトル等の視察に頼っているが、これらを自動化するための方法を提案し、視察によるものと比較・評価したところ、同等の精度が得られた。 さらに、単語中から抽出した音節パターンより子音パターン・母音部の平均化パターンを求め、それに疑似パターンを加えた3種のパターンの連結で音節標準パターンを表わしたもの、および各音韻カテゴリの特徴パラメータの共分散行列を用いて、国語辞典から抽出した200単語の認識実験を不特定の成人男性10名について行なった。今回提案したLESS COST法と併用のパス限定ストキャスティックDP法により、平均約93%の認識率が得られ、本手法が不特定話者の大語彙単語音声に有効であることがわかった。
|