背景雑音を抑制する人工知能を用いた連続音声認識システム

研究課題

研究課題/領域番号	62550269
研究種目	一般研究(C)
配分区分	補助金
研究分野	情報工学
研究機関	慶応義塾大学
研究代表者	中川正雄慶應義塾大学, 理工学部・電気工学科, 教授 (30051882)
研究期間 (年度)	1987 – 1989
研究課題ステータス	完了 (1989年度)
配分額 *注記	2,000千円 (直接経費: 2,000千円) 1989年度: 200千円 (直接経費: 200千円) 1988年度: 200千円 (直接経費: 200千円) 1987年度: 1,600千円 (直接経費: 1,600千円)
キーワード	HMM / 雑音 / 連続音声認識 / Trigram / 人工知能 / 音声認識
研究概要	本研究から以下のことが確認された。 (1)我々は複数の候補を出力可能な隠れマルコフモデル(HMM)を用いたフレ-ム同期型連続音声認識アルゴリズムを提案した。このアルゴリズムは、言語情報としてtrigramを用いた場合には、最適単語系列の近似的な解を求めることができる。本アルゴリズムではさらに、ビ-ムサ-チを導入し演算量の低減を図る。本アルゴリズムを用いて100単語の語彙からなる文の連続音声認識を行った結果、1位の文認識率71.3%、10位までの累積認識率88.8%を得た。この結果は複数の候補を求めない手法に比べ、各々2.5%、12.5%の向上となった。またビ-ムサ-チの導入により演算量の増加も抑えることができた。 (2)我々は環境雑音に強いセパレ-トベクトル量子化(SPVQ)を用いた不特定話者HMM(Hidden Markov Model)音声認識システム(帯域分割SPVQ-HMM方式)を提案した。提案するシステムは音声に重畳する雑音による影響と、発声変形による影響を同時に低減することができる。本方式で実験を行った結果、通常のHMMに比べ5〜16%認識率が向上した。 (3)我々は、日本語の単音節に着目し、単音節レベルと単語レベルの2段階にHMMを用いたシステムを提案した。本システムの特徴は、従来の単語音声認識システムに比べて、辞書を記憶するための記憶容量を低く抑えることができるという点である。また、その効果は大語彙になるほど大きく、500単語の場合には、39%に低減される。本システムで女性1名の発声による100単語の認識実験を行ったところ、99.4%の認識率を得、従来のシステムと同等の認識率で記憶容量を44%低減することができた。

報告書

(4件)

研究成果
(33件)

すべてその他

すべて文献書誌 (33件)

[文献書誌] 片岡淳、南泰浩、中川正雄: "背景雑音を考慮した帯域分割セパレ-トVQーHMM不特定話者音声認識" 電子情報通信学会論文誌.
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1989 研究成果報告書概要
[文献書誌] 南泰浩、中川正雄: "Trigramモデルを用いた複数候補を求めるフレ-ム同期型HMM連続音声認識" 電子情報通信学会論文誌.
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1989 研究成果報告書概要
[文献書誌] 南泰浩、中川正雄: "ADFとプロダクションシステムによる異常信号の検知・除去" 電子通信学会秋季全国大会講演論文集. 1. 129-129 (1987)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1989 研究成果報告書概要
[文献書誌] 米本美奈、南泰浩、中川正雄: "記憶容量を低減したHMM単語音声認識システム" 電子通信学会秋季全国大会講演論文集. A. 1-16-1-16 (1988)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1989 研究成果報告書概要
[文献書誌] 南泰浩、中川正雄: "HMM連続音声認識の高速化" 日本音響学会昭和63年度秋季研究発表会講演論文集. I. 258-259 (1988)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1989 研究成果報告書概要
[文献書誌] 米本美奈、南泰浩、中川正雄: "HMMを2段に用いた単語音声認識システム" 第11回情報理論とその応用シンポジュウム. 865-869 (1988)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1989 研究成果報告書概要
[文献書誌] 南泰浩、中川正雄: "ビ-ムサ-チによるHMM連続音声認識の高速化手法" 第11回情報理論とその応用シンポジュウム. 871-876 (1988)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1989 研究成果報告書概要
[文献書誌] 神田直之、南泰浩、中川正雄: "トリグラムモデルを用いた連続単語音声認識における自動単語分類" 電子通信学会春季全国大会講演論文集. 1. 1-20-1-20 (1989)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1989 研究成果報告書概要
[文献書誌] 岩本直久、南泰浩、水井潔、中川正雄: "可変ビットレ-トADPCM・PARCOR混成音楽符号化方式" 第12回情報理論とその応用シンポジュウム. 761-764 (1989)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1989 研究成果報告書概要
[文献書誌] 片岡淳、南泰浩、中川正雄: "セパレ-トベクトル量子化を用いたHMM音声認識の耐雑音性に関する検討" 第12回情報理論とその応用シンポジュウム. 831-834 (1989)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1989 研究成果報告書概要
[文献書誌] 佐藤正俊、南泰浩、水井潔、中川正雄: "ベクトル量子化を用いる可変フレ-ムレ-トPARCORボコ-ダ" 第12回情報理論とその応用シンポジュウム. 755-760 (1989)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1989 研究成果報告書概要
[文献書誌] 片岡淳、南泰浩、中川正雄: "セパレ-トベクトル量子化を用いたHMM音声認識の耐雑音性に関する検討" 電子情報通信学会春期全国大会講演論文集. A. A-230-A-230 (1989)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1989 研究成果報告書概要
[文献書誌] Jun, KATAOKA, Yasuhiro MINAMI, Masao NAKAGAWA: "A band-division Separate VQ Speaker-Independent HMM Speech Recognition System Considering Extemal Noise." IEICE of Japan.
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1989 研究成果報告書概要
[文献書誌] Yasuhiro MINAMI, Masao NAKAGAWA: "Frame Synchronous HMM connected Word Recognition Obtaining Multiple Candidate Sentences Using Trigram Model." IEICE of Japan.
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1989 研究成果報告書概要
[文献書誌] Yasuhiro MINAMI, Masao NAKAGAWA: "A New Abnormal Signal Detection and Cancellation System by Using ADF and Production System." 1988 Autumn National Convention Record, IEICE, 1987, 1-291.
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1989 研究成果報告書概要
[文献書誌] Mina YONEMOTO, Yasuhiro MINAMI, Masao NAKAGAWA: "Memory Reduced Word Recognition System Using HMM." 1988 Autumn National Convention Record, IEICE, 1988, A-1-16.
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1989 研究成果報告書概要
[文献書誌] Yasuhiro MINAMI, Masao NAKAGAWA: "Fast Algorithm for HMM Continuous Speech Recognition." Proc. Autumn Meet. Acoust. Soc. Jpn., 1988, pp.257-258.
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1989 研究成果報告書概要
[文献書誌] Mina YONEMOTO, Yasuhiro MINAMI, Masao NAKAGAWA: "A System for Isolated-word Recognition Using Two Level Hidden Markov Models." The 11th Symposium on Information Theory and Its Application(SITA'88), 1988, pp.865-869.
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1989 研究成果報告書概要
[文献書誌] Yasuhiro MINAMI, Masao NAKAGAWA: "A Fast Algorithm Based on Beam Search for HMM Continuous Speech Recognition." The 11th Symposium on Information Theory and Its Application(SITA'88), 1988, pp.871-876.
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1989 研究成果報告書概要
[文献書誌] Naoyuki KANDA, Yasuhiro MINAMI, Masao NAKAGAWA: "Automatic Word Classification in Connected Word Recognition Using Trigram Model." 1989 Spring National Convention Record, IEICE, 1989, A-20.
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1989 研究成果報告書概要
[文献書誌] Naohisa IWAMOTO, Yasuhiro MINAMI, Kiyoshi MIZUI, Masao NAKAGAWA: "Variable Bit Rate ADPCM-PARCOR hybrid Instrumental Sound Coding." The 12th Symposium on Information Theory and Its Application(SITA'89), 1989, pp.761-764.
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1989 研究成果報告書概要
[文献書誌] Jun, KATAOKA, Yasuhiro MINAMI, Masao NAKAGAWA: "A Study of Robustness of HMM Speech Recognition System Using Separate Vector Quantization." The 12th Symposium on Information Theory and Its Application(SITA'89), 1989, pp.831-834.
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1989 研究成果報告書概要
[文献書誌] Masatoshi SATOU, Yasuhiro MINAMI, Kiyoshi MIZUI, Masao NAKAGAWA: "Variable Frame Rate PARCOR Vocoder Using Vector Quantization." The 12th Symposium on Information Theory and Its Application(SITA'89), 1989, pp.755-760.
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1989 研究成果報告書概要
[文献書誌] Jun, KATAOKA, Yasuhiro MINAMI, Masao NAKAGAWA: "A Study of Robustness of HMM Speech Recognition System Using Separate Vector Quantization." 1990 Spring National Convention Record, IEICE, 1990, A-230.
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1989 研究成果報告書概要
[文献書誌] 南泰浩,中川正雄: "Trigramモデルを用いた複数候補を求めるフレ-ム同期型HMM連続音声認識" 電子情報通信学会論文誌.
- 関連する報告書
  1989 実績報告書
[文献書誌] 片岡淳,南泰浩,中川正雄: "セパレ-トベクトル量子化を用いたHMM音声認識の耐雑音性に対する検討" 第12回情報理論とその応用シンポジュウム. 831-834 (1989)
- 関連する報告書
  1989 実績報告書
[文献書誌] 片岡淳,南泰浩,中川正雄: "セパレ-トベクトル量子化を用いたHMM音声認識の耐雑音性に対する検討" 1990年電子情報通信学会春期全国大会講演論文集. (1990)
- 関連する報告書
  1989 実績報告書
[文献書誌] 米本美奈,南泰浩,中川正雄: 昭和63年度電子通信学会秋季全国大会講演論文集. 1. A-1-16-A-1-16 (1988)
- 関連する報告書
  1988 実績報告書
[文献書誌] 南泰浩,中川正雄: 日本音響学会昭和63年度秋季研究発表会講演論文集. I. 257-258 (1988)
- 関連する報告書
  1988 実績報告書
[文献書誌] 米本美奈,南泰浩,中川正雄: 第11回情報理論とその応用シンポジュウム. 2. 865-869 (1988)
- 関連する報告書
  1988 実績報告書
[文献書誌] 南泰浩,中川正雄: 第11回情報理論とその応用シンポジュウム. 2. 871-876 (1988)
- 関連する報告書
  1988 実績報告書
[文献書誌] 神田直之,南泰浩,中川正雄: 1989年電子通信学会春季全国大会講演論文集. 1. 1-20-1-20 (1989)
- 関連する報告書
  1988 実績報告書
[文献書誌] 南泰浩,中川正雄: 電子情報通信学会論文誌.
- 関連する報告書
  1988 実績報告書

背景雑音を抑制する人工知能を用いた連続音声認識システム

研究代表者

中川 正雄 慶應義塾大学, 理工学部・電気工学科, 教授 (30051882)

2,000千円 (直接経費: 2,000千円)

報告書

研究成果

[文献書誌] 片岡淳、南泰浩、中川正雄: "背景雑音を考慮した帯域分割セパレ-トVQーHMM不特定話者音声認識" 電子情報通信学会論文誌.

説明

関連する報告書

[文献書誌] 南泰浩、中川正雄: "Trigramモデルを用いた複数候補を求めるフレ-ム同期型HMM連続音声認識" 電子情報通信学会論文誌.

説明

関連する報告書

[文献書誌] 南泰浩、中川正雄: "ADFとプロダクションシステムによる異常信号の検知・除去" 電子通信学会秋季全国大会講演論文集. 1. 129-129 (1987)

説明

関連する報告書

[文献書誌] 米本美奈、南泰浩、中川正雄: "記憶容量を低減したHMM単語音声認識システム" 電子通信学会秋季全国大会講演論文集. A. 1-16-1-16 (1988)

説明

関連する報告書

[文献書誌] 南泰浩、中川正雄: "HMM連続音声認識の高速化" 日本音響学会昭和63年度秋季研究発表会講演論文集. I. 258-259 (1988)

説明

関連する報告書

[文献書誌] 米本美奈、南泰浩、中川正雄: "HMMを2段に用いた単語音声認識システム" 第11回情報理論とその応用シンポジュウム. 865-869 (1988)

説明

関連する報告書

[文献書誌] 南泰浩、中川正雄: "ビ-ムサ-チによるHMM連続音声認識の高速化手法" 第11回情報理論とその応用シンポジュウム. 871-876 (1988)

説明

関連する報告書

[文献書誌] 神田直之、南泰浩、中川正雄: "トリグラムモデルを用いた連続単語音声認識における自動単語分類" 電子通信学会春季全国大会講演論文集. 1. 1-20-1-20 (1989)

説明

関連する報告書

[文献書誌] 岩本直久、南泰浩、水井潔、中川正雄: "可変ビットレ-トADPCM・PARCOR混成音楽符号化方式" 第12回情報理論とその応用シンポジュウム. 761-764 (1989)

説明

関連する報告書

[文献書誌] 片岡淳、南泰浩、中川正雄: "セパレ-トベクトル量子化を用いたHMM音声認識の耐雑音性に関する検討" 第12回情報理論とその応用シンポジュウム. 831-834 (1989)

説明

関連する報告書

[文献書誌] 佐藤正俊、南泰浩、水井潔、中川正雄: "ベクトル量子化を用いる可変フレ-ムレ-トPARCORボコ-ダ" 第12回情報理論とその応用シンポジュウム. 755-760 (1989)

説明

関連する報告書

[文献書誌] 片岡淳、南泰浩、中川正雄: "セパレ-トベクトル量子化を用いたHMM音声認識の耐雑音性に関する検討" 電子情報通信学会春期全国大会講演論文集. A. A-230-A-230 (1989)

説明

関連する報告書

[文献書誌] Jun, KATAOKA, Yasuhiro MINAMI, Masao NAKAGAWA: "A band-division Separate VQ Speaker-Independent HMM Speech Recognition System Considering Extemal Noise." IEICE of Japan.

説明

関連する報告書

[文献書誌] Yasuhiro MINAMI, Masao NAKAGAWA: "Frame Synchronous HMM connected Word Recognition Obtaining Multiple Candidate Sentences Using Trigram Model." IEICE of Japan.

説明

関連する報告書

[文献書誌] Yasuhiro MINAMI, Masao NAKAGAWA: "A New Abnormal Signal Detection and Cancellation System by Using ADF and Production System." 1988 Autumn National Convention Record, IEICE, 1987, 1-291.

説明

関連する報告書

[文献書誌] Mina YONEMOTO, Yasuhiro MINAMI, Masao NAKAGAWA: "Memory Reduced Word Recognition System Using HMM." 1988 Autumn National Convention Record, IEICE, 1988, A-1-16.

説明

関連する報告書

[文献書誌] Yasuhiro MINAMI, Masao NAKAGAWA: "Fast Algorithm for HMM Continuous Speech Recognition." Proc. Autumn Meet. Acoust. Soc. Jpn., 1988, pp.257-258.

説明

関連する報告書

[文献書誌] Mina YONEMOTO, Yasuhiro MINAMI, Masao NAKAGAWA: "A System for Isolated-word Recognition Using Two Level Hidden Markov Models." The 11th Symposium on Information Theory and Its Application(SITA'88), 1988, pp.865-869.

説明

関連する報告書

[文献書誌] Yasuhiro MINAMI, Masao NAKAGAWA: "A Fast Algorithm Based on Beam Search for HMM Continuous Speech Recognition." The 11th Symposium on Information Theory and Its Application(SITA'88), 1988, pp.871-876.

説明

関連する報告書

[文献書誌] Naoyuki KANDA, Yasuhiro MINAMI, Masao NAKAGAWA: "Automatic Word Classification in Connected Word Recognition Using Trigram Model." 1989 Spring National Convention Record, IEICE, 1989, A-20.

説明

関連する報告書

[文献書誌] Naohisa IWAMOTO, Yasuhiro MINAMI, Kiyoshi MIZUI, Masao NAKAGAWA: "Variable Bit Rate ADPCM-PARCOR hybrid Instrumental Sound Coding." The 12th Symposium on Information Theory and Its Application(SITA'89), 1989, pp.761-764.

説明

関連する報告書

[文献書誌] Jun, KATAOKA, Yasuhiro MINAMI, Masao NAKAGAWA: "A Study of Robustness of HMM Speech Recognition System Using Separate Vector Quantization." The 12th Symposium on Information Theory and Its Application(SITA'89), 1989, pp.831-834.

説明

関連する報告書

[文献書誌] Masatoshi SATOU, Yasuhiro MINAMI, Kiyoshi MIZUI, Masao NAKAGAWA: "Variable Frame Rate PARCOR Vocoder Using Vector Quantization." The 12th Symposium on Information Theory and Its Application(SITA'89), 1989, pp.755-760.

説明

関連する報告書

[文献書誌] Jun, KATAOKA, Yasuhiro MINAMI, Masao NAKAGAWA: "A Study of Robustness of HMM Speech Recognition System Using Separate Vector Quantization." 1990 Spring National Convention Record, IEICE, 1990, A-230.

説明

関連する報告書

[文献書誌] 南泰浩,中川正雄: "Trigramモデルを用いた複数候補を求めるフレ-ム同期型HMM連続音声認識" 電子情報通信学会論文誌.

関連する報告書

中川正雄慶應義塾大学, 理工学部・電気工学科, 教授 (30051882)

[文献書誌] 米本美奈,南泰浩,中川正雄: 昭和63年度電子通信学会秋季全国大会講演論文集. 1. A-1-16-A-1-16 (1988)

[文献書誌] 南泰浩,中川正雄: 日本音響学会昭和63年度秋季研究発表会講演論文集. I. 257-258 (1988)

[文献書誌] 神田直之,南泰浩,中川正雄: 1989年電子通信学会春季全国大会講演論文集. 1. 1-20-1-20 (1989)