• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

1991 年度 実績報告書

知的なビ-ムサ-チによる音声認識の研究

研究課題

研究課題/領域番号 01460254
研究機関山形大学

研究代表者

好田 正紀  山形大学, 工学部, 教授 (00205337)

キーワード音声認識 / グラフサ-チ / A^*アルゴリズム / DTW / ビ-ムサ-チ / ベクトル量子化 / HMM / bestーfirstサ-チ
研究概要

大語彙・連続音声を対象とする音声認識では、必然的に膨大となる処理量に対して現実的な時間内で実行可能となるように、認識アルゴリズムをより高度化するための研究が本質的・潜在的に重要である。従来のDTW(dynamic time warping)やHMM(hidden Markov model)による音声認識アルゴリズムは、可能なすべての組み合わせを調べ尽くすという方針のもとに認識アルゴリズムが組み立てられている。DPの技法を利用して能率良く計算する工夫がなされているものの、このままでは認識アルゴリズムの高度化に限界がある。
DTWやHMMによる音声認識は、本質的にグラフサ-チの問題である。ビ-ムサ-チの技法による経路の展開に関して、多くの場合、サ-チ対象の格子点までのスコアのみに基づいて枝刈の判定が行われており、サ-チ対象の格子点以降の推定スコアが考慮されていない。bestーfirstサ-チの技法による経路の展開に関して、A^*アルゴリズムに基づく研究が最近盛んに行われるようになったが、推定スコアの設定法に問題がある。
以上のような動機及び研究動向のもとで、本年度は次の研究成果を得た。
(1)bestーfirstサ-チの技法を利用するDTWによる単語音声認識
・VQ歪、DP、bestーfirstサ-チを利用する推定コスト設定法
(2)bestーfirstサ-チの技法を利用するHMMのViterbiアルゴリズムによる単語音声認識
・最大経路スコア、単純なHMMを利用する推定スコア設定法
(3)bestーfirstサ-チの技法を利用する連続DPによるワ-ドスポッティング
・VQと連続DPを利用する推定コスト設定法

  • 研究成果

    (6件)

すべて その他

すべて 文献書誌 (6件)

  • [文献書誌] 好田 正紀,加藤 正治: "与備選択法を利用するDPビ-ムサ-チの検討" 電子情報通信学会技術研究報告(電子情報通信学会論文誌 発表). SP91ー9. 25-32 (1991)

  • [文献書誌] 好田 正紀,加藤 正治,伊藤 研司: "VQ歪に基づくコストの推定値を用いるDP bestーfirstサ-チの検討" 電子情報通信学会技術研究報告(電子情報通信学会論文誌 発表). SP91ー84. 25-32 (1991)

  • [文献書誌] 好田 正紀: "DPビ-ムサ-チのしきい値関数を入力途中で変更する方法の検討" 電子情報通信学会論文誌(DーII). J75ーDーII. 1-10 (1992)

  • [文献書誌] 好田 正紀,加藤 正治: "DP bestーfirstサ-チによるワ-ドスポッティングの検討" 情報処理学会東北支部研究会(電子情報通信学会論文誌 発表). 91ー3ー6. 1-5 (1992)

  • [文献書誌] 好田 正紀,北村 達也: "単語音声認識におけるViterbi bestーfirstサ-チの検討" 情報処理学会東北支部研究会(電子情報通信学会論文誌 発表). 91ー3ー7. 1-10 (1992)

  • [文献書誌] 好田 正紀,加藤 正治,伊藤 研司: "DP bestーfirstサ-チにおける推定コストの設定法の検討" 日本音響学会講演論文集. I. (1992)

URL: 

公開日: 1993-03-16   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi