1994 Fiscal Year Annual Research Report
自由発話理解のための音声認識アルゴリズム高度化の研究
Project/Area Number |
06680337
|
Research Institution | Yamagata University |
Principal Investigator |
好田 正紀 山形大学, 工学部, 教授 (00205337)
|
Co-Investigator(Kenkyū-buntansha) |
加藤 正治 山形大学, 工学部, 助手 (10250953)
|
Keywords | 音声認識 / ワードスポッティング / HMM / ビームサーチ / best-firstサーチ / A^*探索 / Viterbiアルゴリズム / ヒューリスティクス |
Research Abstract |
自由発話理解を実時間で行うことを目指す.自由発話理解における音声処理を、音素モデル・語彙・構文・意味等の制約を統合したグラフサーチの観点から、最適解を保証するA^*探索の問題として定式化する.各節点のスコア関数におけるヒューリスティクスの合理的な設定法を検討する.認識性能を下げないで、計算量を1/100以下に低減する. 1.文節音声認識 音素HMMと確率文脈自由文法を用いて、認識アルゴリズム高度化に関する研究を行った.確率文脈自由文法を確率LRテーブルに変換してから、Viterbiアルゴリズムの節点上でフレーム同期ビームサーチ、及び、best-firstサーチを比較検討した.確率言語モデルの学習法、音響スコアに対する言語スコアの重み、ヒューリスティクスの設定に用いる音素モデルと言語モデル、ビームサーチのビーム幅等について、認識性能や計算量との関係を明らかにした. 2.文音声中のキーワードの認識(ワードスポッティング) キーワード以外の音声区間を未登録語とみなして音節HMMの連接でモデル化して、認識アルゴリズム高度化に関する研究を行った.音素HMMから日本語の任意の音節を表現するHMMを作成してから、Viterbiアルゴリズムの節点上で全数サーチ、及び、best-firstサーチを比較検討した.音節連接HMMのスコアに対するペナルティ、ヒューリスティクスの設定に用いる音素モデル等について、キーワードの正解検出率・誤検出率や計算量との関係を明らかにした.
|
-
[Publications] 好田正紀: "離散分布型HMMによる単語音声認識におけるビタビbest-firstサーチの検討" 電子情報通信学会論文誌D-II. J77-D-II. 1187-1197 (1994)
-
[Publications] Masaharu Katoh: "A study on Viterbi best-first search for isolated word recognition using duration-controlled HMMs" Proceedings of International Conference on Spoken Language Processing. 1. 263-266 (1994)
-
[Publications] 加藤正治: "連続分布型HMMによる単語音声認識におけるViterbi best-firstサーチの検討" 電子情報通信学会技術研究報告. SP94-24. 9-16 (1994)
-
[Publications] 好田正紀: "音声認識における探索技法" 情報処理学会マルチメディア通信と分散処理ワークショップ. 157-166 (1994)
-
[Publications] 門前聖康: "確率文脈自由文法を用いたHMM-LR文節音声認識におけるViterbi best-firstサーチの検討" 電子情報通信学会技術研究報告. PRU94-69. 37-44 (1994)
-
[Publications] 堀貴明: "連続/セミ連続分布型HMMによる単語音声認識のViterbi best-firstサーチにおける推定スコア設定法の検討" 電子情報通信学会技術研究報告. SP94-79. 1-8 (1994)