• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

1997 年度 研究成果報告書概要

入力音声への適用機能を持つ連続音声認識に関する研究

研究課題

研究課題/領域番号 07458064
研究種目

基盤研究(B)

配分区分補助金
応募区分一般
研究分野 知能情報学
研究機関東北大学

研究代表者

牧野 正三  東北大学, 大型計算機センター, 教授 (00089806)

研究分担者 鈴木 基之  東北大学, 大型計算機センター, 助手 (30282015)
曽根 秀昭  東北大学, 情報科学研究科, 助教授 (40134019)
研究期間 (年度) 1995 – 1997
キーワード連続音声認識 / 音素認識 / 適応機能 / 話者適応
研究概要

音声の大きな変動要因である発生速度の変動と,個人差による変動を予備認識結果を利用して予測し,正規化するシステムの構築を目指して研究を行った.すなわち,入力音声に対してまず音素の認識を行い,その認識結果から発生速度を抽出し,それに基づいて各音素標準パターンの長さを予測する.発生速度による音素標準パターンの変動を解析し,発生速度と入力音声中の母音の平均持続時間とが密接に関係することを見出し,音素標準パターンの長さの変動を入力音声中の平均母音長の1次関数として表し,予測する方法を開発した.男性5名,女性10名の各話者が発声した212単語をもとに,音素標準パターンの長さの予測式と音素標準パターンを作成し,他の男性話者5名の発声した212単語の単語認識にこの方法を適用した結果,頓悟認識率が95.6%から97.3%に改善された.さらに,音素認識における持続時間制約としてこの方法を利用した結果,音素正解率は71.8%から86.3%へと大きく改善された.
同じく音素の予備認識結果から個人差の変動を音素ごとに予測し,音素標準パターンを再構築する方法を開発した.以上の処理によって入力音声からの情報を基にして,発声速度や個人差を考慮した音素標準パターンの再構築をリアルタイムで可能にし,より柔軟で高性能な連続音声認識システムを構築した.

  • 研究成果

    (6件)

すべて その他

すべて 文献書誌 (6件)

  • [文献書誌] M.SUZUKI, S.MAKINO et al.: "A New HMnet Constrution Algorithm Requiring No Contextual Factors" IEICE Trans.on Information and Systems. E78-D, 6. 662-668 (1995)

    • 説明
      「研究成果報告書概要(和文)」より
  • [文献書誌] H.MORI, H.ASO, S.MAKINO: "Robust n-gram Model of Japanese Character and its Application to Document Recognition" IEICE Trans.on Information and Systems. E79-D, 5. 471-476 (1996)

    • 説明
      「研究成果報告書概要(和文)」より
  • [文献書誌] Y.Okimoto, S.Makino: "Phoneme recogniton using reference patterns constructed with discriminative traning and DP matching" Jour.Acoust.Soc.America. 100, 4. 2791-2791 (1996)

    • 説明
      「研究成果報告書概要(和文)」より
  • [文献書誌] M.SUZUKI,S.MAKINO,A.ITO,H.ASO,H.SHIMODAIRA: "A New HMnet Construction Algorithm Requiring No Contextual Factors" IEICE Trans.on Information and Systems. E78-D,6. 662-668 (1995)

    • 説明
      「研究成果報告書概要(欧文)」より
  • [文献書誌] H.MORI,H.ASO,S.MAKINO: "Robust n-gram Model of Japanese Character and its application to Document Recognition" IEICE Trans.on Information and Systems. E79-D,5. 471-476 (1996)

    • 説明
      「研究成果報告書概要(欧文)」より
  • [文献書誌] Y.Okimoto, S.Makino: "Phoneme recognition using reference patterns constructed with discriminative training and DP matching." Jour.Acoust.Soc.America. 100,4. 2791-2791 (1996)

    • 説明
      「研究成果報告書概要(欧文)」より

URL: 

公開日: 1999-03-16  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi