Project/Area Number |
61550261
|
Research Category |
Grant-in-Aid for General Scientific Research (C)
|
Allocation Type | Single-year Grants |
Research Field |
計算機工学
|
Research Institution | Toyohashi University of Technology |
Principal Investigator |
中川 聖一 豊橋技科大, 工学部, 助教授 (20115893)
|
Project Period (FY) |
1986
|
Project Status |
Completed (Fiscal Year 1986)
|
Budget Amount *help |
¥1,300,000 (Direct Cost: ¥1,300,000)
Fiscal Year 1986: ¥1,300,000 (Direct Cost: ¥1,300,000)
|
Keywords | 音声認識 / 不特定話者 / 統計的手法 / 単語音声認識 |
Research Abstract |
大語彙単語音声認識では、標準パターンの記憶量や認識処理量の増大、さらには登録用パターンの発声の負担等が問題となり、単語単位の標準パターンとの照合による方法は非常に困難となる。一方、音韻や音節を認識の単位とする方法が有効と考えられるが、セグメンテーションという非常に難しい問題を解決しなければならず、又音韻系列や音節系列からの単語への変換も容易ではない。そこで、音節パターン等を連結して単語標準パターンを構成し単語単位の認識アルゴリズムを採用する方法が試みられている。しかし、計算量は単語単位の認識法と同等であり改良を要した。 これらの問題を解決する一つとして、研究代表者は、LESS COST法の研究を行なってきた。しかし、それは孤立発声された単音節を連結して単語標準パターンとして用いたため、調音結合の影響を受けた単語中の音節パターンと異なるため認識率の低下を生じた。そこで、今年度、大語彙音声認識の基礎として、単語中から音節を抽出し標準パターンを抽出した。 通常、単語中からの音節抽出は、波形・スペクトル等の視察に頼っているが、これらを自動化するための方法を提案し、視察によるものと比較・評価したところ、同等の精度が得られた。 さらに、単語中から抽出した音節パターンより子音パターン・母音部の平均化パターンを求め、それに疑似パターンを加えた3種のパターンの連結で音節標準パターンを表わしたもの、および各音韻カテゴリの特徴パラメータの共分散行列を用いて、国語辞典から抽出した200単語の認識実験を不特定の成人男性10名について行なった。今回提案したLESS COST法と併用のパス限定ストキャスティックDP法により、平均約93%の認識率が得られ、本手法が不特定話者の大語彙単語音声に有効であることがわかった。
|