自由発話理解のための音声認識アルゴリズム高度化の研究
Project/Area Number |
06680337
|
Research Category |
Grant-in-Aid for General Scientific Research (C)
|
Allocation Type | Single-year Grants |
Research Field |
Intelligent informatics
|
Research Institution | Yamagata University |
Principal Investigator |
好田 正紀 山形大学, 工学部, 教授 (00205337)
|
Co-Investigator(Kenkyū-buntansha) |
加藤 正治 山形大学, 工学部, 助手 (10250953)
|
Project Period (FY) |
1994
|
Project Status |
Completed (Fiscal Year 1994)
|
Budget Amount *help |
¥1,100,000 (Direct Cost: ¥1,100,000)
Fiscal Year 1994: ¥1,100,000 (Direct Cost: ¥1,100,000)
|
Keywords | 音声認識 / ワードスポッティング / HMM / ビームサーチ / best-firstサーチ / A^*探索 / Viterbiアルゴリズム / ヒューリスティクス |
Research Abstract |
自由発話理解を実時間で行うことを目指す.自由発話理解における音声処理を、音素モデル・語彙・構文・意味等の制約を統合したグラフサーチの観点から、最適解を保証するA^*探索の問題として定式化する.各節点のスコア関数におけるヒューリスティクスの合理的な設定法を検討する.認識性能を下げないで、計算量を1/100以下に低減する. 1.文節音声認識 音素HMMと確率文脈自由文法を用いて、認識アルゴリズム高度化に関する研究を行った.確率文脈自由文法を確率LRテーブルに変換してから、Viterbiアルゴリズムの節点上でフレーム同期ビームサーチ、及び、best-firstサーチを比較検討した.確率言語モデルの学習法、音響スコアに対する言語スコアの重み、ヒューリスティクスの設定に用いる音素モデルと言語モデル、ビームサーチのビーム幅等について、認識性能や計算量との関係を明らかにした. 2.文音声中のキーワードの認識(ワードスポッティング) キーワード以外の音声区間を未登録語とみなして音節HMMの連接でモデル化して、認識アルゴリズム高度化に関する研究を行った.音素HMMから日本語の任意の音節を表現するHMMを作成してから、Viterbiアルゴリズムの節点上で全数サーチ、及び、best-firstサーチを比較検討した.音節連接HMMのスコアに対するペナルティ、ヒューリスティクスの設定に用いる音素モデル等について、キーワードの正解検出率・誤検出率や計算量との関係を明らかにした.
|
Report
(1 results)
Research Products
(6 results)