• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

知的なビ-ムサ-チによる音声認識の研究

研究課題

研究課題/領域番号 01460254
研究種目

一般研究(B)

配分区分補助金
研究分野 情報学
研究機関山形大学

研究代表者

好田 正紀  山形大学, 工学部, 教授 (00205337)

研究期間 (年度) 1989 – 1991
研究課題ステータス 完了 (1991年度)
配分額 *注記
6,900千円 (直接経費: 6,900千円)
1991年度: 200千円 (直接経費: 200千円)
1990年度: 1,500千円 (直接経費: 1,500千円)
1989年度: 5,200千円 (直接経費: 5,200千円)
キーワード音声認識 / グラフサ-チ / A^*アルゴリズム / DTW / ビ-ムサ-チ / ベクトル量子化 / HMM / bestーfirstサ-チ / DPマッチング / 予備選択 / DPビ-ムサ-チ / 閾値関数 / 枝刈 / フレ-ム同期DPマッチング
研究概要

大語彙・連続音声を対象とする音声認識では、必然的に膨大となる処理量に対して現実的な時間内で実行可能となるように、認識アルゴリズムをより高度化するための研究が本質的・潜在的に重要である.従来のDTW(dynamic time warping)やHMM(hidden Markov model)による音声認識アルゴリズムは、可能なすべての組み合わせを調べ尽くすという方針のもとに認識アルゴリズムが組み立てられている.DPの技法を利用して能率良く計算する工夫がなされているものの、すべての組み合わせを調べることに基本的に変わりはなく、このままでは認識アルゴリズムの高度化に限界がある.
DTWやHMMによる音声認識は、本質的にグラフサ-チの問題である.ビ-ムサ-チの技法による経路の展開に関して、多くの場合、サ-チ対象の格子点までのスコアのみに基づいて枝刈の判定が行われており、サ-チ対象の格子点以降の推定スコアが考慮されていない.bestーfirstサ-チの技法による経路の展開に関して、DTWによる音声認識においては、推定コストの設定法等に問題がある.HMMによる音声認識においては、A^*アルゴリズムに基づく研究が最近盛んに行われるようになった.
本報告書は、以上のような動機及び研究動向のもとで、DTWやHMMによる音声認識アルゴリズムをグラフサ-チの問題とみなして行った研究成果を取りまとめたものである.第1章では、ビ-ムサ-チの技法を利用するDTWによる音声認識に関する研究成果を述べる.第2章では、bestーfirstサ-チの技法を利用するDTWによる音声認識に関する研究成果を述べる.第3章では、bestーfirstサ-チの技法を利用するHMMのViterbiアルゴリズムによる音声認識に関する研究成果を述べる.

報告書

(4件)
  • 1991 実績報告書   研究成果報告書概要
  • 1990 実績報告書
  • 1989 実績報告書
  • 研究成果

    (25件)

すべて その他

すべて 文献書誌 (25件)

  • [文献書誌] 好田 正紀: "DPビ-ムサ-チのしきい値関数の検討" 電子情報通信学会論文誌(DーII). J72ーDーII. 1248-1255 (1989)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1991 研究成果報告書概要
  • [文献書誌] 好田 正紀: "DPビ-ムサ-チのしきい値関数を入力途中で変更する方法の検討" 電子情報通信学会論文誌(DーII). J75ーDーII. 1-10 (1992)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1991 研究成果報告書概要
  • [文献書誌] 好田 正紀,加藤 正治: "予備選択法を利用するDPビ-ムサ-チの検討" 電子情報通信学会技術研究報告(電子情報通信学会論文誌). SP91ー9. 25-32 (1991)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1991 研究成果報告書概要
  • [文献書誌] 好田 正紀,加藤 正治,伊藤 研司: "VQ歪に基づくコストの推定値を用いるDP bestーfirstサ-チの検討" 電子情報通信学会技術研究報告(電子情報通信学会論文誌). SP91ー84. 25-32 (1991)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1991 研究成果報告書概要
  • [文献書誌] 好田 正紀,加藤 正治: "DP bestーfirstサ-チによるワ-ドスポッティングの検討" 情報処理学会東北支部研究会(電子情報通信学会論文誌). 91ー3ー6. 1-5 (1992)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1991 研究成果報告書概要
  • [文献書誌] 好田 正紀,北村 達也: "単語音声認識におけるViterbi bestーfirstサ-チの検討" 情報処理学会東北支部研究会(電子情報通信学会論文誌). 91ー3ー7. 1-10 (1992)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1991 研究成果報告書概要
  • [文献書誌] M. Kohda: ""A study on pruning strategies for DP beam search"" Trans. IEICE. J72-D-II, 8. 1248-1255 (1989)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1991 研究成果報告書概要
  • [文献書誌] M. Kohda: ""A study on modifying pruning strategies for DP beam search at a present input frame"" Trans. IEICE. J75-D-II, 1. 1-10 (1992)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1991 研究成果報告書概要
  • [文献書誌] M. Kohda, M. Katoh: ""A study on utilizing a VQ-based preprocessor in DP beam search for speech recognition"" IEICE, Technical Report. SP91-9. (1991)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1991 研究成果報告書概要
  • [文献書誌] M. Kohda, M. Katoh, K. Itoh: ""A study on the dynamic programming best-first search using a cost estimate based on VQ distortion"" IEICE, Technical Report. SP91-84. (1991)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1991 研究成果報告書概要
  • [文献書誌] M. Kohda, M. Katoh: ""A study of word spotting with the dynamic programming best-first search algorithm"" ASJ Meeting. 1-1-21. (1992)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1991 研究成果報告書概要
  • [文献書誌] M. Kohda, T. Kitamura: "A study on Viterbi best-first search for isolated word recognition"" ASJ Meeting. 1-1-25. (1992)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1991 研究成果報告書概要
  • [文献書誌] 好田 正紀,加藤 正治: "与備選択法を利用するDPビ-ムサ-チの検討" 電子情報通信学会技術研究報告(電子情報通信学会論文誌 発表). SP91ー9. 25-32 (1991)

    • 関連する報告書
      1991 実績報告書
  • [文献書誌] 好田 正紀,加藤 正治,伊藤 研司: "VQ歪に基づくコストの推定値を用いるDP bestーfirstサ-チの検討" 電子情報通信学会技術研究報告(電子情報通信学会論文誌 発表). SP91ー84. 25-32 (1991)

    • 関連する報告書
      1991 実績報告書
  • [文献書誌] 好田 正紀: "DPビ-ムサ-チのしきい値関数を入力途中で変更する方法の検討" 電子情報通信学会論文誌(DーII). J75ーDーII. 1-10 (1992)

    • 関連する報告書
      1991 実績報告書
  • [文献書誌] 好田 正紀,加藤 正治: "DP bestーfirstサ-チによるワ-ドスポッティングの検討" 情報処理学会東北支部研究会(電子情報通信学会論文誌 発表). 91ー3ー6. 1-5 (1992)

    • 関連する報告書
      1991 実績報告書
  • [文献書誌] 好田 正紀,北村 達也: "単語音声認識におけるViterbi bestーfirstサ-チの検討" 情報処理学会東北支部研究会(電子情報通信学会論文誌 発表). 91ー3ー7. 1-10 (1992)

    • 関連する報告書
      1991 実績報告書
  • [文献書誌] 好田 正紀,加藤 正治,伊藤 研司: "DP bestーfirstサ-チにおける推定コストの設定法の検討" 日本音響学会講演論文集. I. (1992)

    • 関連する報告書
      1991 実績報告書
  • [文献書誌] 好田 正紀: "DPビ-ムサ-チによる単語音声認識" 東北大学応用情報学研究センタ-シンポジウム予稿集. 16. 19-26 (1990)

    • 関連する報告書
      1990 実績報告書
  • [文献書誌] 好田 正紀: "DPビ-ムサ-チにおいて格子点の数を制限する場合の検討" 日本音響学会平成2年度秋季研究発表会講演論文集. I. 91-92 (1990)

    • 関連する報告書
      1990 実績報告書
  • [文献書誌] 好田 正紀: "予備選択法を利用するDPビ-ムサ-チの検討" 日本音響学会平成3年度春季研究発表会講演論文集. I. (1991)

    • 関連する報告書
      1990 実績報告書
  • [文献書誌] 好田 正紀: "DPビ-ムサ-チの閾値関数を入力途中で変更する方法の検討" 電子情報通信学会論文誌(DーII). (1991)

    • 関連する報告書
      1990 実績報告書
  • [文献書誌] 好田正紀: "DPビ-ムサ-チのしきい値関数の検討" 電子情報通信学会論文誌(D-II). J72-D-II. 1248-1255 (1989)

    • 関連する報告書
      1989 実績報告書
  • [文献書誌] 好田正紀: "DPビ-ムサ-チの閾値関数を入力音声の途中で変更する方法の検討" 電子情報通信学会技術研究報告SP89-13. 89. 9-16 (1989)

    • 関連する報告書
      1989 実績報告書
  • [文献書誌] 好田正紀: "DPビ-ムサ-チによる単語音声認識" 東北大学応用情報学研究センタ-シンポジウム論文集. (1990)

    • 関連する報告書
      1989 実績報告書

URL: 

公開日: 1989-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi