• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

1991 年度 研究成果報告書概要

知的なビ-ムサ-チによる音声認識の研究

研究課題

研究課題/領域番号 01460254
研究種目

一般研究(B)

配分区分補助金
研究分野 情報学
研究機関山形大学

研究代表者

好田 正紀  山形大学, 工学部, 教授 (00205337)

研究期間 (年度) 1989 – 1991
キーワード音声認識 / グラフサ-チ / A^*アルゴリズム / DTW / ビ-ムサ-チ / ベクトル量子化 / HMM / bestーfirstサ-チ
研究概要

大語彙・連続音声を対象とする音声認識では、必然的に膨大となる処理量に対して現実的な時間内で実行可能となるように、認識アルゴリズムをより高度化するための研究が本質的・潜在的に重要である.従来のDTW(dynamic time warping)やHMM(hidden Markov model)による音声認識アルゴリズムは、可能なすべての組み合わせを調べ尽くすという方針のもとに認識アルゴリズムが組み立てられている.DPの技法を利用して能率良く計算する工夫がなされているものの、すべての組み合わせを調べることに基本的に変わりはなく、このままでは認識アルゴリズムの高度化に限界がある.
DTWやHMMによる音声認識は、本質的にグラフサ-チの問題である.ビ-ムサ-チの技法による経路の展開に関して、多くの場合、サ-チ対象の格子点までのスコアのみに基づいて枝刈の判定が行われており、サ-チ対象の格子点以降の推定スコアが考慮されていない.bestーfirstサ-チの技法による経路の展開に関して、DTWによる音声認識においては、推定コストの設定法等に問題がある.HMMによる音声認識においては、A^*アルゴリズムに基づく研究が最近盛んに行われるようになった.
本報告書は、以上のような動機及び研究動向のもとで、DTWやHMMによる音声認識アルゴリズムをグラフサ-チの問題とみなして行った研究成果を取りまとめたものである.第1章では、ビ-ムサ-チの技法を利用するDTWによる音声認識に関する研究成果を述べる.第2章では、bestーfirstサ-チの技法を利用するDTWによる音声認識に関する研究成果を述べる.第3章では、bestーfirstサ-チの技法を利用するHMMのViterbiアルゴリズムによる音声認識に関する研究成果を述べる.

  • 研究成果

    (12件)

すべて その他

すべて 文献書誌 (12件)

  • [文献書誌] 好田 正紀: "DPビ-ムサ-チのしきい値関数の検討" 電子情報通信学会論文誌(DーII). J72ーDーII. 1248-1255 (1989)

    • 説明
      「研究成果報告書概要(和文)」より
  • [文献書誌] 好田 正紀: "DPビ-ムサ-チのしきい値関数を入力途中で変更する方法の検討" 電子情報通信学会論文誌(DーII). J75ーDーII. 1-10 (1992)

    • 説明
      「研究成果報告書概要(和文)」より
  • [文献書誌] 好田 正紀,加藤 正治: "予備選択法を利用するDPビ-ムサ-チの検討" 電子情報通信学会技術研究報告(電子情報通信学会論文誌). SP91ー9. 25-32 (1991)

    • 説明
      「研究成果報告書概要(和文)」より
  • [文献書誌] 好田 正紀,加藤 正治,伊藤 研司: "VQ歪に基づくコストの推定値を用いるDP bestーfirstサ-チの検討" 電子情報通信学会技術研究報告(電子情報通信学会論文誌). SP91ー84. 25-32 (1991)

    • 説明
      「研究成果報告書概要(和文)」より
  • [文献書誌] 好田 正紀,加藤 正治: "DP bestーfirstサ-チによるワ-ドスポッティングの検討" 情報処理学会東北支部研究会(電子情報通信学会論文誌). 91ー3ー6. 1-5 (1992)

    • 説明
      「研究成果報告書概要(和文)」より
  • [文献書誌] 好田 正紀,北村 達也: "単語音声認識におけるViterbi bestーfirstサ-チの検討" 情報処理学会東北支部研究会(電子情報通信学会論文誌). 91ー3ー7. 1-10 (1992)

    • 説明
      「研究成果報告書概要(和文)」より
  • [文献書誌] M. Kohda: ""A study on pruning strategies for DP beam search"" Trans. IEICE. J72-D-II, 8. 1248-1255 (1989)

    • 説明
      「研究成果報告書概要(欧文)」より
  • [文献書誌] M. Kohda: ""A study on modifying pruning strategies for DP beam search at a present input frame"" Trans. IEICE. J75-D-II, 1. 1-10 (1992)

    • 説明
      「研究成果報告書概要(欧文)」より
  • [文献書誌] M. Kohda, M. Katoh: ""A study on utilizing a VQ-based preprocessor in DP beam search for speech recognition"" IEICE, Technical Report. SP91-9. (1991)

    • 説明
      「研究成果報告書概要(欧文)」より
  • [文献書誌] M. Kohda, M. Katoh, K. Itoh: ""A study on the dynamic programming best-first search using a cost estimate based on VQ distortion"" IEICE, Technical Report. SP91-84. (1991)

    • 説明
      「研究成果報告書概要(欧文)」より
  • [文献書誌] M. Kohda, M. Katoh: ""A study of word spotting with the dynamic programming best-first search algorithm"" ASJ Meeting. 1-1-21. (1992)

    • 説明
      「研究成果報告書概要(欧文)」より
  • [文献書誌] M. Kohda, T. Kitamura: "A study on Viterbi best-first search for isolated word recognition"" ASJ Meeting. 1-1-25. (1992)

    • 説明
      「研究成果報告書概要(欧文)」より

URL: 

公開日: 1993-03-16  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi