1991 Fiscal Year Annual Research Report
Project/Area Number |
01460254
|
Research Institution | Yamagata University |
Principal Investigator |
好田 正紀 山形大学, 工学部, 教授 (00205337)
|
Keywords | 音声認識 / グラフサ-チ / A^*アルゴリズム / DTW / ビ-ムサ-チ / ベクトル量子化 / HMM / bestーfirstサ-チ |
Research Abstract |
大語彙・連続音声を対象とする音声認識では、必然的に膨大となる処理量に対して現実的な時間内で実行可能となるように、認識アルゴリズムをより高度化するための研究が本質的・潜在的に重要である。従来のDTW(dynamic time warping)やHMM(hidden Markov model)による音声認識アルゴリズムは、可能なすべての組み合わせを調べ尽くすという方針のもとに認識アルゴリズムが組み立てられている。DPの技法を利用して能率良く計算する工夫がなされているものの、このままでは認識アルゴリズムの高度化に限界がある。 DTWやHMMによる音声認識は、本質的にグラフサ-チの問題である。ビ-ムサ-チの技法による経路の展開に関して、多くの場合、サ-チ対象の格子点までのスコアのみに基づいて枝刈の判定が行われており、サ-チ対象の格子点以降の推定スコアが考慮されていない。bestーfirstサ-チの技法による経路の展開に関して、A^*アルゴリズムに基づく研究が最近盛んに行われるようになったが、推定スコアの設定法に問題がある。 以上のような動機及び研究動向のもとで、本年度は次の研究成果を得た。 (1)bestーfirstサ-チの技法を利用するDTWによる単語音声認識 ・VQ歪、DP、bestーfirstサ-チを利用する推定コスト設定法 (2)bestーfirstサ-チの技法を利用するHMMのViterbiアルゴリズムによる単語音声認識 ・最大経路スコア、単純なHMMを利用する推定スコア設定法 (3)bestーfirstサ-チの技法を利用する連続DPによるワ-ドスポッティング ・VQと連続DPを利用する推定コスト設定法
|
-
[Publications] 好田 正紀,加藤 正治: "与備選択法を利用するDPビ-ムサ-チの検討" 電子情報通信学会技術研究報告(電子情報通信学会論文誌 発表). SP91ー9. 25-32 (1991)
-
[Publications] 好田 正紀,加藤 正治,伊藤 研司: "VQ歪に基づくコストの推定値を用いるDP bestーfirstサ-チの検討" 電子情報通信学会技術研究報告(電子情報通信学会論文誌 発表). SP91ー84. 25-32 (1991)
-
[Publications] 好田 正紀: "DPビ-ムサ-チのしきい値関数を入力途中で変更する方法の検討" 電子情報通信学会論文誌(DーII). J75ーDーII. 1-10 (1992)
-
[Publications] 好田 正紀,加藤 正治: "DP bestーfirstサ-チによるワ-ドスポッティングの検討" 情報処理学会東北支部研究会(電子情報通信学会論文誌 発表). 91ー3ー6. 1-5 (1992)
-
[Publications] 好田 正紀,北村 達也: "単語音声認識におけるViterbi bestーfirstサ-チの検討" 情報処理学会東北支部研究会(電子情報通信学会論文誌 発表). 91ー3ー7. 1-10 (1992)
-
[Publications] 好田 正紀,加藤 正治,伊藤 研司: "DP bestーfirstサ-チにおける推定コストの設定法の検討" 日本音響学会講演論文集. I. (1992)