• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

連続音声認識のための音素認識における言語情報利用に関する研究

研究課題

研究課題/領域番号 03452173
研究種目

一般研究(B)

配分区分補助金
研究分野 情報工学
研究機関千葉工業大学

研究代表者

城戸 健一  千葉工業大学, 工学部, 教授 (30006209)

研究分担者 牧野 正三  東北大学, 応用情報学研究センタ, 助教授 (00089806)
荒井 秀一  千葉工業大学, 工学部, 講師 (20212590)
浮貝 雅裕  千葉工業大学, 工学部, 助教授 (80118695)
菅原 研次  千葉工業大学, 工学部, 教授 (00137853)
三井田 惇郎  千葉工業大学, 工学部, 教授 (10083859)
伊與田 光宏  千葉工業大学, 工学部, 助教授 (90160069)
研究期間 (年度) 1991 – 1993
研究課題ステータス 完了 (1993年度)
配分額 *注記
6,800千円 (直接経費: 6,800千円)
1993年度: 900千円 (直接経費: 900千円)
1992年度: 2,000千円 (直接経費: 2,000千円)
1991年度: 3,900千円 (直接経費: 3,900千円)
キーワード連続音声認識 / 音声認識 / 音素認識 / 不特定話者 / 言語情報
研究概要

本研究では、不特定話者の音声を対象にして音素認識を高率で行うために、既存の音素認識法以外の高性能な音素認識法の提案と、音素を挟む長い時間区間にわたる言語情報を利用し得る言語処理法の開発を行った。
基本となる音素認識法の改善として、時間-周波数分解能を制御できるWavelet変換を用いたHMMによる音素認識法としてMR-HMMを提案した。このMR-HMMを学習する方法は、様々なものが考えられるが、本研究では状態マージ学習法を提案することにより高い認識率を得ることができた。
さらに音素認識の誤りに対処するための基本的枠組として、音素を挟む長い時間区間にわたる言語情報を利用し得るようにするために、現在の音声認識法のほとんどが利用しているケプストラム系の音響特徴量に固執せず、9種類の特徴量を併用する音素認識法を提案した。一般的に複数の特徴量を併用するには、各音響特徴量がどの音素の特徴を表現し得るかを予め調べた上で認識法を決定する必要があるが、本研究では、2カテゴリの分類に用いられる線形判別法を、帰属度という尺度を新たに提案することにより、多カテゴリの分類に利用可能にし、用いる特徴量の種類に依存せず、音響処理の結果の信頼性を示す指針を言語処理部へわたすことを可能にした。
最後に、自由会話文に対応するために、文法的知識を用いず語の表層的共起関係に着目することで、音素認識の誤りをTopdownに制御できる構造を有する言語処理法を提案した。これにより日常会話文のように、文法が適用できないような自由な発声に対しても基本的には対応が可能であることが確認された。

報告書

(4件)
  • 1993 実績報告書   研究成果報告書概要
  • 1992 実績報告書
  • 1991 実績報告書
  • 研究成果

    (24件)

すべて その他

すべて 文献書誌 (24件)

  • [文献書誌] 柵橋健二: "異常発声音の評価を目的とした音声分析表示法の予備的検討" 電子情報通信学会技術研究会資料. EA93-33. 17-23 (1993)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1993 研究成果報告書概要
  • [文献書誌] 大内康裕: "正常および異常音声の第1・第2フォルマント平面における比較" 日本音響学会秋季研究発表会講演論文集. 593-594 (1993)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1993 研究成果報告書概要
  • [文献書誌] 柵橋健二: "正常および異常音声のフォルマント周波数の時間遷移パターンによる比較" 日本音響学会秋季研究発表会講演論文集. 595-596 (1993)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1993 研究成果報告書概要
  • [文献書誌] Shozo Makino: "Speech to Text Conversion System Based on Phoneme Recognition" Annals of Applied Information Science. 18. 51-65 (1993)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1993 研究成果報告書概要
  • [文献書誌] 栗原世治: "各種音響パラメータが保持する個人性情報の分析" 日本音響学会秋季研究発表会講演論文集. 645-646 (1993)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1993 研究成果報告書概要
  • [文献書誌] 小林淳: "動詞、名詞のスポッティングによる会話文の認識" 日本音響学会秋季研究発表会講演論文集. 175-176 (1993)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1993 研究成果報告書概要
  • [文献書誌] 棚橋健二: "異常発声音の評価を目的とした音声分析表示法の予備的検討" 電子情報通信学会技術研究会資料. EA93-33. 17-23 (1993)

    • 関連する報告書
      1993 実績報告書
  • [文献書誌] 大内康裕: "正常および異常音声の第1・第2フォルマント平面における比較" 日本音響学会秋期研究発表会講演論文集. 593-594 (1993)

    • 関連する報告書
      1993 実績報告書
  • [文献書誌] 棚橋健二: "正常および異常音声のフォルマント周波数の時間遷移パターンによる比較" 日本音響学会秋期研究発表会講演論文集. 595-596 (1993)

    • 関連する報告書
      1993 実績報告書
  • [文献書誌] Shozo Makino: "Speech to Text Conversion System Based on Phoneme Recognition" Annals of Applied Information Science. 18. 51-65 (1993)

    • 関連する報告書
      1993 実績報告書
  • [文献書誌] 栗原世治: "各種音響パラメータが保持する個人性情報の分析" 日本音響学会秋期研究発表会講演論文集. 645-646 (1993)

    • 関連する報告書
      1993 実績報告書
  • [文献書誌] 小林淳: "動詞、名詞のスポッティングによる会話文の認識" 日本音響学会秋期研究発表会講演論文集. 175-176 (1993)

    • 関連する報告書
      1993 実績報告書
  • [文献書誌] 張 中: "ホルマントを用いた中国単語母音の分析と認識" 日本音響学会誌. 47. 281-288 (1991)

    • 関連する報告書
      1992 実績報告書
  • [文献書誌] 伊藤 彰則: "機能語予測CYK法による日本語文音声の統語処理" 電子情報通信学会誌. J74-D11,9. 1147-1155 (1991)

    • 関連する報告書
      1992 実績報告書
  • [文献書誌] 熊切 義博: "短時間FFTによる音声分析ディスプレイ装置" 日本音響学会春期研究発表会講演論文集. 1-5-17. 431-432 (1992)

    • 関連する報告書
      1992 実績報告書
  • [文献書誌] 牧野 正三: "Recognition on phonemes in continuous speech using a modified LVQ2 method" Journal Acoustic Society Japan. Vol.13. 351-360 (1992)

    • 関連する報告書
      1992 実績報告書
  • [文献書誌] 荒井 秀一: "A Network for Phenome Recognition by Spectral Local Peaks" Proc.14th International Congress on Acoustics. G-4-1. 877-878 (1992)

    • 関連する報告書
      1992 実績報告書
  • [文献書誌] 張 中: "調音結合モデルに基づく中国語音声認識システムの音素認識" 電子情報通信学会誌. J74-D11,9. 1156-1164 (1991)

    • 関連する報告書
      1992 実績報告書
  • [文献書誌] 張 中: "ホルマントを用いた中国語単母音の分析と認識" 日本音響学会誌. 47. 281-288 (1991)

    • 関連する報告書
      1991 実績報告書
  • [文献書誌] 伊藤 彰則: "機能語予測CYK法による日本語文音声の統語処理" 電子情報通信学会誌. J74ーDII,9. 1147-1155 (1991)

    • 関連する報告書
      1991 実績報告書
  • [文献書誌] 張 中: "調音結合モデルを基づく中国語音声認識システムの音素認識" 電子情報通信学会誌. J74ーDII,9. 1156-1164 (1991)

    • 関連する報告書
      1991 実績報告書
  • [文献書誌] 古賀 秀昭: "性別判定と多数決を用いたロ-カルピ-クによる単語中母音の認識" 日本音響学会秋季研究発表会講演論文集. 1ー5ー9. 17-18 (1991)

    • 関連する報告書
      1991 実績報告書
  • [文献書誌] 棚橋 健二: "短時間FFTによる音声分析ー母音分析による検討ー" 日本音響学会春季研究発表会講演論文集. 2ーQー1. 159-160 (1992)

    • 関連する報告書
      1991 実績報告書
  • [文献書誌] 熊切 義博: "短時間FFTによる音声分析ディスプレイ装置" 日本音響学会学季研究発表会講演論文集. 1ー5ー17. 431-432 (1992)

    • 関連する報告書
      1991 実績報告書

URL: 

公開日: 1991-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi