• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

双方向探索に基づく高精度音声認識に関する研究

研究課題

研究課題/領域番号 07680401
研究種目

基盤研究(C)

配分区分補助金
応募区分一般
研究分野 知能情報学
研究機関徳島大学

研究代表者

北 研二  徳島大学, 工学部, 助教授 (10243734)

研究期間 (年度) 1995 – 1997
研究課題ステータス 完了 (1997年度)
配分額 *注記
2,000千円 (直接経費: 2,000千円)
1997年度: 700千円 (直接経費: 700千円)
1996年度: 600千円 (直接経費: 600千円)
1995年度: 700千円 (直接経費: 700千円)
キーワード音声認識 / 双方向探索 / 隠れマルコフモデル / One-Passアルゴリズム / 音響モデル / 言語モデル / 有限オートマトン / 確率文脈自由文法
研究概要

本研究では、双方向型の探索方式に基づく連続音声認識に関する研究を行った。双方向型の探索とは、入力された音声の始端と終端の両方向から探索を行なうものであり、一方向側の探索で認識誤りを起こしても、別方向側の探索で誤りを回復できる可能性を持っているため、高精度の認識を行うことができる。従来のleft-to-right型の探索では、初期の段階での認識誤りが致命的なエラーを引き起こす可能性があったが、双方型の探索を行うことで、このような認識誤りを減少させることができる。
我々は、隠れマルコフモデル(HMM)に基づく音響モデルを用いて、フレーム(時間)同期One-Pass型の音声認識プログラムを開発し、これにForward-Backward探索アルゴリズムに基づく双方向探索機能を組み込んだ。この認識プログラムでは、前向き探索で得られる認識仮説と後向き探索で得られる認識仮説の2つを組み合わせることにより、入力音声全体に対する認識仮説を構成するが、本プログラムでは後ろ向き探索時には有限オートマトンを、また前向き探索時には有限オートマトンあるいは文脈自由文法が使用可能であるように設計した。
また、開発した音声認識プログラムを用いて、さまざまな探索条件のもとでの評価実験を行った。認識実験では、評価音声データとしATR自動翻訳電話研究所発行の研究用日本語音声データベースに収録されている音声データを用いた。認識実験においては、まず後向き方向に認識を行い各フレーム毎に有限オートマトンの状態番号と、その状態番号における尤度を保存し、保存した情報を用いて前向き方向に有限オートマトン制約あるいは文脈自由文法制約による探索を行った。文脈自由文法制約による探索では、文脈自由文法をLR.構文解析表に展開し、LR.構文解析表の状態番号と有限オートマトンの状態の対応付けを行うことにより、認識仮説の接続可能性チェックを行った。なお、HMMは継続時間長制御なし、子音3状態、母音1状態とした。前向き探索あるいは後向き探索で有限オートマトン制約を使った場合の認識率が77.1%〜87.3%なのに比べ、双方向探索を行うことで認識率を87.5%〜88.6%まで向上させることができ、双方向型探索の有効性を示すことができた。

報告書

(4件)
  • 1997 実績報告書   研究成果報告書概要
  • 1996 実績報告書
  • 1995 実績報告書
  • 研究成果

    (28件)

すべて その他

すべて 文献書誌 (28件)

  • [文献書誌] Kenji Kita et al.: "One-Pass Scarch Algorithm for Continuous Speech Recognition Using Generalized LR Parsing:A CFG-Driven.Frame-Synchronous HMM-Based Approach" Transactions of IPSJ. 36・5. 1252-1259 (1995)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1997 研究成果報告書概要
  • [文献書誌] Kenji Kita et al.: "VOICEDIC:A Practical Application of Speech Recognition Technology" Symbiosis of Human and Artifact. 535-540 (1995)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1997 研究成果報告書概要
  • [文献書誌] 柘植 覚, 北 研二: "Forward-Backward探索に基づく連続音声認識" 電気関係学会四国支部連合大会講演論文集. 258-259 (1996)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1997 研究成果報告書概要
  • [文献書誌] Kenji Kita: "Mixture Probabilistic Context-Free Grammar:An Improvement of a Probabilistic Context-Free Grammar Using Cluster-Based Language Modeling" Journal of Natural Language Processing. 3・4. 103-113 (1996)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1997 研究成果報告書概要
  • [文献書誌] kenji Kita et al.: "Automatic Acquisition of Probabilistic Dialogue Models" Proceedings of ICSLP96. 196-199 (1996)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1997 研究成果報告書概要
  • [文献書誌] 小田 裕樹, 北 研二: "単語の位置情報に基づくコーパスからのコロケーションの自動抽出" 自然言語処理. 5・1. 79-99 (1998)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1997 研究成果報告書概要
  • [文献書誌] 北 研二 他: "音声言語処理" 森北出版, 169 (1996)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1997 研究成果報告書概要
  • [文献書誌] Kenji Kita et al.: "One-Pass Search Algorithm for Continuous Speech Recognition Using Generalized LR Parsing : A CFG-Driven, Frame-Synchronous HMM-Based Approach" Transactions of IPSJ. Vol.36, No.5. 1252-1259 (1995)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1997 研究成果報告書概要
  • [文献書誌] Kenji Kita et al.: "VOICEDIC : A Practical Application of Speech Recognition Technology" Symbiosis of Human and Artifact. 535-540 (1995)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1997 研究成果報告書概要
  • [文献書誌] Satoru Tsuge, Kenji Kita: "Continuous Speech Recognition Based on Forward-Backward Search (in Japanese)" Proceedings of IEICE Shikoku Branch Meeting. 258-259 (1996)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1997 研究成果報告書概要
  • [文献書誌] Kenji Kita: "Mixture Probabilistic Context-Free Grammar : An Improvement of a Probabilistic Context-Free Grammar Using Cluster-Based Language Modeling" Journal of Natural Language Processing. Vol.3, No.4. 103-113 (1996)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1997 研究成果報告書概要
  • [文献書誌] Kenji Kita et al.: "Automatic Acquisition of Probabilistic Dialogue Models" Proceedings of ICSLP96. 196-199 (1996)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1997 研究成果報告書概要
  • [文献書誌] Hiroki Oda, Kenji Kita: "Automatically Extracting Collocations Based on Words Position Information in Corpora (in Jpanese)" Journal of Natural Language Processing. Vol.5, No.1. 79-99 (1998)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1997 研究成果報告書概要
  • [文献書誌] Kenji Kita et al.: "Collocations in Language Learuing : Corpus-Based Automatic Compilation of Collocations and Bilingual Collocation Concordancer" Computer Assisted Language Learning. 10・3. 229-238 (1997)

    • 関連する報告書
      1997 実績報告書
  • [文献書誌] 北 研二: "確率的言語モデルに基づく多言語コーパスからの言語系統樹の再構築" 自然言語処理. 4・3. 71-82 (1997)

    • 関連する報告書
      1997 実績報告書
  • [文献書誌] 北 研二 他: "発話タイプ付きコーパスを用いた確率的対話モデルの自動生成" 自然言語処理. 4・4. 73-85 (1997)

    • 関連する報告書
      1997 実績報告書
  • [文献書誌] Kenji Kita et al.: "A Probabilistic-model-based Language Clustering Approach : To Reconstruct Language System Tree from the Multilingual Corpus" Proceedings of JSCL-97. 109-114 (1997)

    • 関連する報告書
      1997 実績報告書
  • [文献書誌] Paliwal K.K., 北 研二 他: "自由発話音声認識における音響分析の比較" 日本音響学会講演論文集. 5-6 (1997)

    • 関連する報告書
      1997 実績報告書
  • [文献書誌] 小田 裕樹, 北 研二: "単語の位置情報に基づくコーパスからのコロケーションの自動抽出" 自然言語処理. 5・1. 79-99 (1998)

    • 関連する報告書
      1997 実績報告書
  • [文献書誌] 拓殖 覚: "Forward-Backward探索に基づく連続音声認識" 電気関係学会四国支部連合大会講演論文集. 258-259 (1996)

    • 関連する報告書
      1996 実績報告書
  • [文献書誌] Kenji Kita: "Mixture Probabilistic Context-Free Grammar:An Improvement of a Probabilistic Context-Free Grammar Using Cluster-Based Language Modeling" Journal of Natural Language Processing. 3・4. 103-113 (1996)

    • 関連する報告書
      1996 実績報告書
  • [文献書誌] Kenji Kita: "Automatic Acquisition of Probabilistic Dialogue Models" Proceedings of ICSLP96. 196-199 (1996)

    • 関連する報告書
      1996 実績報告書
  • [文献書誌] Kenji Kita: "Automatic Acquisition of Probabilistic Dialogue Models" Proceedings of IIZUKA96. 925-928 (1996)

    • 関連する報告書
      1996 実績報告書
  • [文献書誌] Kenji Kita: "Improvement of a Probabilistic CFG Using a Cluster-Based Language Modeling Technique" Proceedings of IIZUKA96. 929-932 (1996)

    • 関連する報告書
      1996 実績報告書
  • [文献書誌] Kenji Kita: "Dialogue Knowledge Acquisition from Annotated Corpora" Proceedings of IEEE SMC96. 556-561 (1996)

    • 関連する報告書
      1996 実績報告書
  • [文献書誌] Kenji Kita: "One-Pass Search Algorithm for Continuous Speech Recognition Using Generalized LR Parsing : A CFG-Driven,Frame-Synchronous HMM-Based Approach" Transactions of Information Processing Society of Japan. 36. 1252-1259 (1995)

    • 関連する報告書
      1995 実績報告書
  • [文献書誌] Kenji Kita: "Voicedic : A Practical Application of Speech Recognition Technology" Symbiosis of Human Artifact. 535-540 (1995)

    • 関連する報告書
      1995 実績報告書
  • [文献書誌] Tatsuya Iwasa: "Error Correction of Speech Recognition Outputs Using Generalized LR Parsing and Confusion Matrix" Proceedings of ROCLING VIII. 101-110 (1995)

    • 関連する報告書
      1995 実績報告書

URL: 

公開日: 1995-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi