A^*探索による自由発話音声の認識アルゴリズム高度化の研究

研究課題

研究課題/領域番号	07680379
研究種目	基盤研究(C)
配分区分	補助金
応募区分	一般
研究分野	知能情報学
研究機関	山形大学
研究代表者	好田正紀山形大学, 工学部, 教授 (00205337)
研究分担者	加藤正治山形大学, 工学部, 助手 (10250953)
研究期間 (年度)	1995 – 1996
研究課題ステータス	完了 (1996年度)
配分額 *注記	1,700千円 (直接経費: 1,700千円) 1996年度: 300千円 (直接経費: 300千円) 1995年度: 1,400千円 (直接経費: 1,400千円)
キーワード	音声認識 / 音響モデル / 言語モデル / HMM / HM-Net / N-gram / 音素決定木 / 尤度正規化 / サーチ手法 / 単語予備選択
研究概要	自由発話音声の認識処理を、音響モデル・語彙・言語モデル等の制約を統合したグラフ上の探索問題に定式化し、認識性能を下げないで計算量を大幅に低減することを目指して、認識アルゴリズムの要素技術である音響モデル、単語マッチング、言語モデルの高度化に重点をおいて研究を進めた. 1.音響モデルの精密化と話者適応音素環境依存の音響モデルHM-Netを、音素決定木に基づく逐次状態分割法で自動生成する手法DT-SSSを提案した.DT-SSSにより、高精度かつあらゆる未知コンテキストも表現可能なHM-Netが生成できるようになり、時間方向の状態分割や適切な初期モデルが、生成されるHM-Netの性能改善に有効であることを確認した.また、MAP推定法によるHM-Netの話者適応の有効性を検討した. 2.単語マッチングの高速化と尤度正規化簡略な音響モデルと最適音素系列を利用する単語予備選択法を検討した.15000語の単語認識実験で、語彙の1%を候補として予備選択したとき、その中に正解単語が99%以上の確率で含まれて、単語マッチングの計算量は全数探索の4.1%に低減できることを確認した.また、連続音声中の単語区間の尤度を正規化するために、音節連接HMMの上位N個の平均スコアの基づく正規化法を提案し、連続音声認識におけるワードスポッティングや高速マッチングに適用して有効であることを認識した。 3.言語モデルの構築とタスク適応 EDRコーパス(20万文、500万語)を用いてN-gram言語モデルを構築し、学習テキストの量とN-gramの性能の間にどのような関係があるかを調べて、高精度なN-gramを構築するために必要な学習テキスト量や語彙数を名らかにした.また、既存の大量の言語データに特定タスクの言語データを少量混合することによって、N-gram言語モデルのタスク適応が有効であることを確認した.

報告書

(3件)

1996 実績報告書研究成果報告書概要
1995 実績報告書

研究成果
(24件)

すべてその他

すべて文献書誌 (24件)

[文献書誌] 伊藤彰則: "かな・漢字文字列の連鎖統計による言語モデル" 電子情報通信学会論文誌. 79-D-II,12. 2062-2069 (1996)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1996 研究成果報告書概要
[文献書誌] 伊藤彰則: "Language modelling by string pattern N-gram for Japanese speech recognition" 音声言語処理に関する国際会議(ICSLP). Vol.1. 490-493 (1996)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1996 研究成果報告書概要
[文献書誌] 伊藤彰則: "対話音声認識のための事前タスク適応の検討" 電子情報通信学会技術研究報告. S96-81. 25-32 (1996)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1996 研究成果報告書概要
[文献書誌] 堀貴明: "音素決定木に基づく逐次状態分割法によるHMnetの性能改善" 電子情報通信学会技術研究報告. S96-80. 17-24 (1996)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1996 研究成果報告書概要
[文献書誌] 加藤正治: "最適音素系列に基づく単語予備選択法の検討" 電子情報通信学会技術研究報告. S96-13. 9-14 (1996)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1996 研究成果報告書概要
[文献書誌] 伊藤彰則: "大語彙言語データベースからのN-gram構築とタスク適応の検討" 情報処理学会音声言語情報処理研究会. SLP-11-5. 25-30 (1996)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1996 研究成果報告書概要
[文献書誌] A.Ito, M.Kohda: "Language Modeling by Kana and Kanji String N-gram" Trans.IEICE. Vol.J79-D-II,No.12. 2062-2069 (1996)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1996 研究成果報告書概要
[文献書誌] A.Ito, M.Kohda: "Language Modelling by String Pattern N-gram for Japanese Speech Recongition" Proc.International Conference on Spoken Language Processing. Vol.1. 490-493 (1996)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1996 研究成果報告書概要
[文献書誌] A.Ito, M.Kohda: "Task Adaptation of a Stochastic Language Model for Dialogue Speech Recognition" Technical Report of IEICE. SP96-81. 25-32 (1996)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1996 研究成果報告書概要
[文献書誌] T.Hori, M.Katoh, A.Ito, M.Kohda: "A Study on Improvement of HM-Nets Using Decision Tree-based Successive State Splitting" Technical Report of IEICE. SP96-80. 17-24 (1996)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1996 研究成果報告書概要
[文献書誌] M.Katoh, A.Ito, M.Kohda: "A Study on Word Preselection Utilizing Optimal Phoneme Sequence" Technical Report of IEICE. SP96-13. 9-14 (1996)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1996 研究成果報告書概要
[文献書誌] A.Ito, N.Daishima, A.maruyama, M.Katoh, M.Kohda: "N-gram Estimation from Japanese Large Corpus and Task Adaptation of N-gram" Technical Report of IPSJ. SLP-11-5. 25-30 (1996)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1996 研究成果報告書概要
[文献書誌] 伊藤彰則: "かな・漢字文字列の連鎖統計による言語モデル" 電子情報通信学会論文誌. 79-D-II,12. 2062-2069 (1996)
- 関連する報告書
  1996 実績報告書
[文献書誌] 伊藤彰則: "Language modelling by string pattern N-gram for Japanese speech recognition" 音声言語処理に関する国際会議(ICSLP). Vol.1. 490-493 (1996)
- 関連する報告書
  1996 実績報告書
[文献書誌] 伊藤彰則: "対話音声認識のための事前タスク適応の検討" 電子情報通信学会技術研究報告. SP96-81. 25-32 (1996)
- 関連する報告書
  1996 実績報告書
[文献書誌] 堀貴明: "音素決定木に基づく逐次状態分割法によるHMnetの性能改善" 電子情報通信学会技術研究報告. SP96-80. 17-24 (1996)
- 関連する報告書
  1996 実績報告書
[文献書誌] 加藤正治: "最適音素系列に基づく単語予備選択法の検討" 電子情報通信学会技術研究報告. SP96-13. 9-14 (1996)
- 関連する報告書
  1996 実績報告書
[文献書誌] 伊藤彰則: "大語彙言語データベースからのN-gram構築とタスク適応の検討" 情報処理学会音声言語情報処理研究会. SLP-11-5. 25-30 (1996)
- 関連する報告書
  1996 実績報告書
[文献書誌] 加藤正治: "HMMによるワードスポッティングにおけるViterbi best-firsサーチの検討" 情報処理学会東北支部研究会資料. 94-4-4. 1-6 (1995)
- 関連する報告書
  1995 実績報告書
[文献書誌] 大関雅和: "確率文脈自由文法を用いたHMM-LR文節音声認識におけるフレーム同期ビームサーチの検討" 情報処理学会東北支部研究会資料. 94-4-5. 1-8 (1995)
- 関連する報告書
  1995 実績報告書
[文献書誌] 伊藤彰則: "文字列パターンのN-gramによる文節モデルの検討" 電子情報通信学会技術研究報告. SP95-96. 19-24 (1995)
- 関連する報告書
  1995 実績報告書
[文献書誌] 堀貴明: "音素決定木に基づく逐次状態分割によるHM-Netの検討" 日本音響学会研究発表会講演論文集. 1. 145-146 (1996)
- 関連する報告書
  1995 実績報告書
[文献書誌] 加藤正治: "最適音素系列に基づく単語予備選択法の検討" 日本音響学会研究発表会講演論文集. 1. 79-80 (1996)
- 関連する報告書
  1995 実績報告書
[文献書誌] 代島直人: "大語彙言語データベースからのN-gram構築とタスク適応の検討" 情報処理学会東北支部研究会資料. 95-5-17. 1-7 (1996)
- 関連する報告書
  1995 実績報告書

A^*探索による自由発話音声の認識アルゴリズム高度化の研究

研究代表者

好田 正紀 山形大学, 工学部, 教授 (00205337)

1,700千円 (直接経費: 1,700千円)

報告書

研究成果

[文献書誌] 伊藤彰則: "かな・漢字文字列の連鎖統計による言語モデル" 電子情報通信学会論文誌. 79-D-II,12. 2062-2069 (1996)

説明

関連する報告書

[文献書誌] 伊藤彰則: "Language modelling by string pattern N-gram for Japanese speech recognition" 音声言語処理に関する国際会議(ICSLP). Vol.1. 490-493 (1996)

説明

関連する報告書

[文献書誌] 伊藤彰則: "対話音声認識のための事前タスク適応の検討" 電子情報通信学会技術研究報告. S96-81. 25-32 (1996)

説明

関連する報告書

[文献書誌] 堀貴明: "音素決定木に基づく逐次状態分割法によるHMnetの性能改善" 電子情報通信学会技術研究報告. S96-80. 17-24 (1996)

説明

関連する報告書

[文献書誌] 加藤正治: "最適音素系列に基づく単語予備選択法の検討" 電子情報通信学会技術研究報告. S96-13. 9-14 (1996)

説明

関連する報告書

[文献書誌] 伊藤彰則: "大語彙言語データベースからのN-gram構築とタスク適応の検討" 情報処理学会音声言語情報処理研究会. SLP-11-5. 25-30 (1996)

説明

関連する報告書

[文献書誌] A.Ito, M.Kohda: "Language Modeling by Kana and Kanji String N-gram" Trans.IEICE. Vol.J79-D-II,No.12. 2062-2069 (1996)

説明

関連する報告書

[文献書誌] A.Ito, M.Kohda: "Language Modelling by String Pattern N-gram for Japanese Speech Recongition" Proc.International Conference on Spoken Language Processing. Vol.1. 490-493 (1996)

説明

関連する報告書

[文献書誌] A.Ito, M.Kohda: "Task Adaptation of a Stochastic Language Model for Dialogue Speech Recognition" Technical Report of IEICE. SP96-81. 25-32 (1996)

説明

関連する報告書

[文献書誌] T.Hori, M.Katoh, A.Ito, M.Kohda: "A Study on Improvement of HM-Nets Using Decision Tree-based Successive State Splitting" Technical Report of IEICE. SP96-80. 17-24 (1996)

説明

関連する報告書

[文献書誌] M.Katoh, A.Ito, M.Kohda: "A Study on Word Preselection Utilizing Optimal Phoneme Sequence" Technical Report of IEICE. SP96-13. 9-14 (1996)

説明

関連する報告書

[文献書誌] A.Ito, N.Daishima, A.maruyama, M.Katoh, M.Kohda: "N-gram Estimation from Japanese Large Corpus and Task Adaptation of N-gram" Technical Report of IPSJ. SLP-11-5. 25-30 (1996)

説明

関連する報告書

[文献書誌] 伊藤彰則: "かな・漢字文字列の連鎖統計による言語モデル" 電子情報通信学会論文誌. 79-D-II,12. 2062-2069 (1996)

関連する報告書

[文献書誌] 伊藤彰則: "Language modelling by string pattern N-gram for Japanese speech recognition" 音声言語処理に関する国際会議(ICSLP). Vol.1. 490-493 (1996)

関連する報告書

[文献書誌] 伊藤彰則: "対話音声認識のための事前タスク適応の検討" 電子情報通信学会技術研究報告. SP96-81. 25-32 (1996)

関連する報告書

[文献書誌] 堀貴明: "音素決定木に基づく逐次状態分割法によるHMnetの性能改善" 電子情報通信学会技術研究報告. SP96-80. 17-24 (1996)

関連する報告書

[文献書誌] 加藤正治: "最適音素系列に基づく単語予備選択法の検討" 電子情報通信学会技術研究報告. SP96-13. 9-14 (1996)

関連する報告書

[文献書誌] 伊藤彰則: "大語彙言語データベースからのN-gram構築とタスク適応の検討" 情報処理学会音声言語情報処理研究会. SLP-11-5. 25-30 (1996)

関連する報告書

[文献書誌] 加藤正治: "HMMによるワードスポッティングにおけるViterbi best-firsサーチの検討" 情報処理学会東北支部研究会資料. 94-4-4. 1-6 (1995)

関連する報告書

[文献書誌] 大関雅和: "確率文脈自由文法を用いたHMM-LR文節音声認識におけるフレーム同期ビームサーチの検討" 情報処理学会東北支部研究会資料. 94-4-5. 1-8 (1995)

関連する報告書

[文献書誌] 伊藤彰則: "文字列パターンのN-gramによる文節モデルの検討" 電子情報通信学会技術研究報告. SP95-96. 19-24 (1995)

関連する報告書

[文献書誌] 堀貴明: "音素決定木に基づく逐次状態分割によるHM-Netの検討" 日本音響学会研究発表会講演論文集. 1. 145-146 (1996)

関連する報告書

[文献書誌] 加藤正治: "最適音素系列に基づく単語予備選択法の検討" 日本音響学会研究発表会講演論文集. 1. 79-80 (1996)

関連する報告書

[文献書誌] 代島直人: "大語彙言語データベースからのN-gram構築とタスク適応の検討" 情報処理学会東北支部研究会資料. 95-5-17. 1-7 (1996)

関連する報告書

好田正紀山形大学, 工学部, 教授 (00205337)