入力音声への適用機能を持つ連続音声認識に関する研究

研究課題

研究課題/領域番号	07458064
研究種目	基盤研究(B)
配分区分	補助金
応募区分	一般
研究分野	知能情報学
研究機関	東北大学
研究代表者	牧野正三東北大学, 大型計算機センター, 教授 (00089806)
研究分担者	鈴木基之東北大学, 大型計算機センター, 助手 (30282015) 曽根秀昭東北大学, 情報科学研究科, 助教授 (40134019) 伊藤彰則山形大学, 工学部, 講師 (70232428) 安倍正人東北大学, 大型計算機センター, 助教授 (00159443)
研究期間 (年度)	1995 – 1997
研究課題ステータス	完了 (1997年度)
配分額 *注記	6,400千円 (直接経費: 6,400千円) 1997年度: 900千円 (直接経費: 900千円) 1996年度: 700千円 (直接経費: 700千円) 1995年度: 4,800千円 (直接経費: 4,800千円)
キーワード	連続音声認識 / 音素認識 / 適応機能 / 話者適応 / 発声速度 / 持続時間 / 予備認識
研究概要	音声の大きな変動要因である発生速度の変動と,個人差による変動を予備認識結果を利用して予測し,正規化するシステムの構築を目指して研究を行った.すなわち,入力音声に対してまず音素の認識を行い,その認識結果から発生速度を抽出し,それに基づいて各音素標準パターンの長さを予測する.発生速度による音素標準パターンの変動を解析し,発生速度と入力音声中の母音の平均持続時間とが密接に関係することを見出し,音素標準パターンの長さの変動を入力音声中の平均母音長の1次関数として表し,予測する方法を開発した.男性5名,女性10名の各話者が発声した212単語をもとに,音素標準パターンの長さの予測式と音素標準パターンを作成し,他の男性話者5名の発声した212単語の単語認識にこの方法を適用した結果,頓悟認識率が95.6%から97.3%に改善された.さらに,音素認識における持続時間制約としてこの方法を利用した結果,音素正解率は71.8%から86.3%へと大きく改善された. 同じく音素の予備認識結果から個人差の変動を音素ごとに予測し,音素標準パターンを再構築する方法を開発した.以上の処理によって入力音声からの情報を基にして,発声速度や個人差を考慮した音素標準パターンの再構築をリアルタイムで可能にし,より柔軟で高性能な連続音声認識システムを構築した.

報告書

(4件)

研究成果
(22件)

すべてその他

すべて文献書誌 (22件)

[文献書誌] M.SUZUKI, S.MAKINO et al.: "A New HMnet Constrution Algorithm Requiring No Contextual Factors" IEICE Trans.on Information and Systems. E78-D, 6. 662-668 (1995)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1997 研究成果報告書概要
[文献書誌] H.MORI, H.ASO, S.MAKINO: "Robust n-gram Model of Japanese Character and its Application to Document Recognition" IEICE Trans.on Information and Systems. E79-D, 5. 471-476 (1996)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1997 研究成果報告書概要
[文献書誌] Y.Okimoto, S.Makino: "Phoneme recogniton using reference patterns constructed with discriminative traning and DP matching" Jour.Acoust.Soc.America. 100, 4. 2791-2791 (1996)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1997 研究成果報告書概要
[文献書誌] M.SUZUKI,S.MAKINO,A.ITO,H.ASO,H.SHIMODAIRA: "A New HMnet Construction Algorithm Requiring No Contextual Factors" IEICE Trans.on Information and Systems. E78-D,6. 662-668 (1995)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1997 研究成果報告書概要
[文献書誌] H.MORI,H.ASO,S.MAKINO: "Robust n-gram Model of Japanese Character and its application to Document Recognition" IEICE Trans.on Information and Systems. E79-D,5. 471-476 (1996)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1997 研究成果報告書概要
[文献書誌] Y.Okimoto, S.Makino: "Phoneme recognition using reference patterns constructed with discriminative training and DP matching." Jour.Acoust.Soc.America. 100,4. 2791-2791 (1996)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1997 研究成果報告書概要
[文献書誌] S.MAKIKO, M.SUZUKI, A.HARADA: "Automatic Acquistion of Language Model using HMnet" Proc.Int.Conf Speech Processing'97. I. 47-54 (1997)
- 関連する報告書
  1997 実績報告書
[文献書誌] 原田, 鈴木, 牧野: "離散型HMnetによる新聞記事からの文節モデルの獲得" 電子情報通信学会技術報告. SP97・24. 45-50 (1997)
- 関連する報告書
  1997 実績報告書
[文献書誌] 阿部, 鈴木, 牧野, 阿曽: "音素毎の話者クラスタリングに基づく話者適応法" 電子情報通信学会技術報告. SP97・74. 41-46 (1997)
- 関連する報告書
  1997 実績報告書
[文献書誌] 森, 阿曽, 牧野: "再現性を考慮した文字列に基づく統計的言語モデル" 電子情報通信学会技術報告. NLC97・47. 29-34 (1997)
- 関連する報告書
  1997 実績報告書
[文献書誌] 鈴木,阿曽,牧野: "SSS-freeに基づくHMnetを用いた不特定話者音素認識" 日本音響学会講演論文集. 春季号. 143-144 (1996)
- 関連する報告書
  1996 実績報告書
[文献書誌] 大坂,牧野: "発声速度に基づく音素持続時間予測を用いた音素認識" 信学技報. Vol. 96 No. 93. 1-6 (1996)
- 関連する報告書
  1996 実績報告書
[文献書誌] 沖本,牧野: "可変長パターンと識別学習を用いた音素認識" 信学技報. Vol. 96 No. 93. 7-14 (1996)
- 関連する報告書
  1996 実績報告書
[文献書誌] Y. Okimoto, S. Makino: "Phoneme Recognition using reference patterns constructed with discriminative training and DP matching" THE JOURNAL of the Acoustical Society of America. Vol. 100 No. 4. 2757-2757 (1996)
- 関連する報告書
  1996 実績報告書
[文献書誌] M. Suzuki, S. Makino: "Acquisition of language models based on HMnet" THE JOURNAL of the Acoustical Society of America. Vol. 100 No. 4. 2791-2791 (1996)
- 関連する報告書
  1996 実績報告書
[文献書誌] 牧野正三: "東北大一松下単語音声データベース" 人文学と情報処理. 第12号. 56-59 (1996)
- 関連する報告書
  1996 実績報告書
[文献書誌] 古賀,牧野,城戸: "ローカルピークによる単母音認識に及ぼす時間窓とリフタの影響" 日本音響学会誌. 51. 130-132 (1995)
- 関連する報告書
  1995 実績報告書
[文献書誌] 伊藤,牧野: "拡張PHA法による連続音声認識のための単語予備選択" 電子情報通信学会論文誌D-II. J-78-D-II. 400-408 (1995)
- 関連する報告書
  1995 実績報告書
[文献書誌] M、SUZUKI,S.MAKINO,H、ASO,H、SHIMODAIRA: "A New HM net Construction Algorithm Requiniag No Contextual Factors" IEICE Trens.INF,& SYST.E-78-D. 662-668 (1995)
- 関連する報告書
  1995 実績報告書
[文献書誌] 鈴木,牧野,阿曽: "離散型HMnetの言語モデルへの適用" 電子情報通信学会技術研究報告. SP95-33. 65-72 (1995)
- 関連する報告書
  1995 実績報告書
[文献書誌] 沖本,牧野,曽根: "確率尺度によるDPマッチングを用いた音素のセグメンテーション" 日本音響学会講演論文集. I. 165-166 (1995)
- 関連する報告書
  1995 実績報告書
[文献書誌] 大坂,牧野,曽根: "予備認識結果に基づく持続時間予測の音素認識における効果" 日本音響学会講演論文集. I. 55-56 (1995)
- 関連する報告書
  1995 実績報告書

入力音声への適用機能を持つ連続音声認識に関する研究

研究代表者

牧野 正三 東北大学, 大型計算機センター, 教授 (00089806)

6,400千円 (直接経費: 6,400千円)

報告書

研究成果

[文献書誌] M.SUZUKI, S.MAKINO et al.: "A New HMnet Constrution Algorithm Requiring No Contextual Factors" IEICE Trans.on Information and Systems. E78-D, 6. 662-668 (1995)

説明

関連する報告書

[文献書誌] H.MORI, H.ASO, S.MAKINO: "Robust n-gram Model of Japanese Character and its Application to Document Recognition" IEICE Trans.on Information and Systems. E79-D, 5. 471-476 (1996)

説明

関連する報告書

[文献書誌] Y.Okimoto, S.Makino: "Phoneme recogniton using reference patterns constructed with discriminative traning and DP matching" Jour.Acoust.Soc.America. 100, 4. 2791-2791 (1996)

説明

関連する報告書

[文献書誌] M.SUZUKI,S.MAKINO,A.ITO,H.ASO,H.SHIMODAIRA: "A New HMnet Construction Algorithm Requiring No Contextual Factors" IEICE Trans.on Information and Systems. E78-D,6. 662-668 (1995)

説明

関連する報告書

[文献書誌] H.MORI,H.ASO,S.MAKINO: "Robust n-gram Model of Japanese Character and its application to Document Recognition" IEICE Trans.on Information and Systems. E79-D,5. 471-476 (1996)

説明

関連する報告書

[文献書誌] Y.Okimoto, S.Makino: "Phoneme recognition using reference patterns constructed with discriminative training and DP matching." Jour.Acoust.Soc.America. 100,4. 2791-2791 (1996)

説明

関連する報告書

[文献書誌] S.MAKIKO, M.SUZUKI, A.HARADA: "Automatic Acquistion of Language Model using HMnet" Proc.Int.Conf Speech Processing'97. I. 47-54 (1997)

関連する報告書

[文献書誌] 原田, 鈴木, 牧野: "離散型HMnetによる新聞記事からの文節モデルの獲得" 電子情報通信学会技術報告. SP97・24. 45-50 (1997)

関連する報告書

[文献書誌] 阿部, 鈴木, 牧野, 阿曽: "音素毎の話者クラスタリングに基づく話者適応法" 電子情報通信学会技術報告. SP97・74. 41-46 (1997)

関連する報告書

[文献書誌] 森, 阿曽, 牧野: "再現性を考慮した文字列に基づく統計的言語モデル" 電子情報通信学会技術報告. NLC97・47. 29-34 (1997)

関連する報告書

[文献書誌] 鈴木,阿曽,牧野: "SSS-freeに基づくHMnetを用いた不特定話者音素認識" 日本音響学会講演論文集. 春季号. 143-144 (1996)

関連する報告書

[文献書誌] 大坂,牧野: "発声速度に基づく音素持続時間予測を用いた音素認識" 信学技報. Vol. 96 No. 93. 1-6 (1996)

関連する報告書

[文献書誌] 沖本,牧野: "可変長パターンと識別学習を用いた音素認識" 信学技報. Vol. 96 No. 93. 7-14 (1996)

関連する報告書

[文献書誌] Y. Okimoto, S. Makino: "Phoneme Recognition using reference patterns constructed with discriminative training and DP matching" THE JOURNAL of the Acoustical Society of America. Vol. 100 No. 4. 2757-2757 (1996)

関連する報告書

[文献書誌] M. Suzuki, S. Makino: "Acquisition of language models based on HMnet" THE JOURNAL of the Acoustical Society of America. Vol. 100 No. 4. 2791-2791 (1996)

関連する報告書

[文献書誌] 牧野 正三: "東北大一松下単語音声データベース" 人文学と情報処理. 第12号. 56-59 (1996)

関連する報告書

[文献書誌] 古賀,牧野,城戸: "ローカルピークによる単母音認識に及ぼす時間窓とリフタの影響" 日本音響学会誌. 51. 130-132 (1995)

関連する報告書

[文献書誌] 伊藤,牧野: "拡張PHA法による連続音声認識のための単語予備選択" 電子情報通信学会論文誌D-II. J-78-D-II. 400-408 (1995)

関連する報告書

[文献書誌] M、SUZUKI,S.MAKINO,H、ASO,H、SHIMODAIRA: "A New HM net Construction Algorithm Requiniag No Contextual Factors" IEICE Trens.INF,& SYST.E-78-D. 662-668 (1995)

関連する報告書

[文献書誌] 鈴木,牧野,阿曽: "離散型HMnetの言語モデルへの適用" 電子情報通信学会技術研究報告. SP95-33. 65-72 (1995)

関連する報告書

[文献書誌] 沖本,牧野,曽根: "確率尺度によるDPマッチングを用いた音素のセグメンテーション" 日本音響学会講演論文集. I. 165-166 (1995)

関連する報告書

[文献書誌] 大坂,牧野,曽根: "予備認識結果に基づく持続時間予測の音素認識における効果" 日本音響学会講演論文集. I. 55-56 (1995)

関連する報告書

牧野正三東北大学, 大型計算機センター, 教授 (00089806)

[文献書誌] 牧野正三: "東北大一松下単語音声データベース" 人文学と情報処理. 第12号. 56-59 (1996)