• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

音素セグメンテーションユニットを用いる大語彙単語音声認識システム

研究課題

研究課題/領域番号 05555102
研究種目

試験研究(B)

配分区分補助金
研究分野 情報通信工学
研究機関東京工業大学

研究代表者

今井 聖  東京工業大学, 精密工学研究所, 教授 (50016763)

研究分担者 谷口 一郎  東京工業大学, 精密工学研究所, 助手 (10242314)
研究期間 (年度) 1993 – 1994
研究課題ステータス 完了 (1994年度)
配分額 *注記
9,900千円 (直接経費: 9,900千円)
1994年度: 700千円 (直接経費: 700千円)
1993年度: 9,200千円 (直接経費: 9,200千円)
キーワード単語音声認識 / 音素セグメンテーション / 音素ラベリング / 大語彙 / マルチレファレンスパターン / 並列音素ラベリング方式 / セグメントラティス / マルチセグメンテーション方式 / 大語彙化
研究概要

本研究により,高性能の大語彙単語音声認識システムを実現する上で音素セグメンテーションと音素ラベリングを行う方式が極めて有用であることが確かめられ、実時間動作のハードウェアの実現の見通しが得られた.本研究を通して得られた主な成果,知見等は次の通りである.
A.大語彙単語音声認識に対して,音素セグメンテーションと音素ラベリングが極めて重要な役割を果していることを再確認した.本研究の方法,HMMによる方法,ニューラルネットによる方法などによって大語彙単語音声認識に関する予備実験を行い,比較検討したところ,本研究の方法が有効なものであることが確認された.
B.本研単語音声認識システムは,大語彙化によってシステムの規模が著しく大きくなることおよびレファレンスモデルの作成や学習が複雑化することはないと予想されたが,このことが確認された.
C.特定話者のシステムによる認識実験で,単語数が1845語,4915語の場合の上位3位認識率は、それぞれ,96.5%,94.5%となり2万語の場合の推定値は約90%となった.誤りの主な原因は音素セグメンテーションのエラーと音素ラベリングのエラーによるものであることが確かめられた.
D.セグメンテーションのエラーを低減するために,マルチセグメンテーション方式を考案したが,認識率の改善は1%程度で,効果は十分なものではなかった.現在,別の方法を試みている。
E.音素ラベリングのエラーを低減し,システムを不特定話者対応とするために,並列音素ラベリング方式を提案した。認識率の向上,不特定話者対応に対し極めて効果のあるものであることが確認できた.
F.現在のシステムの単語認識に必要な処理時は1単語あたり約5秒でなるが,参照単語の予備選択の方法により,約1/3に低減できた.

報告書

(3件)
  • 1994 実績報告書   研究成果報告書概要
  • 1993 実績報告書
  • 研究成果

    (25件)

すべて その他

すべて 文献書誌 (25件)

  • [文献書誌] 鈴木 良弥: "体示的な意味カテゴリーで記述された係り受け関係を利用する日本語文音声認識" 電子情報通信学会論文誌. J76-D-II. 2264-2273 (1993)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1994 研究成果報告書概要
  • [文献書誌] 今井 聖: "並列音素ラベリング(PPL)方式による話者独立単語音声認識システム" 電子情報通信学会論文誌. J77-A. 143-152 (1994)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1994 研究成果報告書概要
  • [文献書誌] 菅野 俊夫: "雑音劣化音声の一般化ケプストラムモデル化における事前情報の利用" 電子情報通信学会論文誌. J77-A. 945-953 (1994)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1994 研究成果報告書概要
  • [文献書誌] 古市 千枝子: "話者独立な特徴パラメータを用いた英語連続音声の音素セグメンテーションシステム" 電子情報通信学会論文誌. J78-A. 295-304 (1995)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1994 研究成果報告書概要
  • [文献書誌] Ming-Shen Wang: "A New Approach of Parsing and Speech Based on the Divide and Conquer Strategy for Continuous Speech Recognition" IEICE Trans. on Information and Systems. E78-D. (1995)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1994 研究成果報告書概要
  • [文献書誌] 胡 力游: "中国語連続音声の声調認識" 電子情報通信学会論文誌. J78-A. (1995)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1994 研究成果報告書概要
  • [文献書誌] 今井 聖: "信号処理工学" コロナ社(テレビジョン学会編), 201 (1993)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1994 研究成果報告書概要
  • [文献書誌] 今井 聖: "音声認識" 共立出版, 200 (1995)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      1994 研究成果報告書概要
  • [文献書誌] Y.Suzuki, C.Furuichi, S.Imai: ""Spokrn Japanese Sentence Recognition Using Dependency Relationship with Systematical Semantic Category" (in Japanese)" Trans.IEICE. J76-D-II[11]. 2264-2273 (1993)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1994 研究成果報告書概要
  • [文献書誌] S.Imai, I.Taniguchi, C.Furuichi, T.Kawasaki and H.Doi: ""Speaker-Independent Spoken Word Recognition System Based on Parallel Phoneme Labeling Method" (in Japanese)" Trans.IEICE. J77-A[2]. 143-152 (1994)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1994 研究成果報告書概要
  • [文献書誌] T.Kanno, T.Kobayashi and S.Imai: ""On the Use of a priori Information in Generalized Cepstral Modeling of Degraded Speech" (in Japanese)" Trans.IEICE. J77-A[7]. 945-953 (1994)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1994 研究成果報告書概要
  • [文献書誌] C.Furuich, K.Aizawa and S.Imai: ""Automatic Phonemic Segmentation System of English Continuous Speech by Using Speaker-Independent Features" (in Japanese)" Trans.IEICE. J78-A[3]. 295-304 (1995)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1994 研究成果報告書概要
  • [文献書誌] M.S.Wang and S.Imai: ""A New Approach of Parsing and Search Based on the Divide and Conquer Strategy for Continuous Speech Recognition"" IEICE Trans. Inf.& Syst. E78-D[7]. (1995)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1994 研究成果報告書概要
  • [文献書誌] L.Hu and S.Imai: ""Tone Recognition for Continuous Mandarin Speech" (in Japanese)" Trans.IEICE. J78-A[7]. (1995)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1994 研究成果報告書概要
  • [文献書誌] S.Imai: Signal Processing Technology (in Japanese). Corona Publishing Co., Ltd., 201 (1993)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1994 研究成果報告書概要
  • [文献書誌] S.Imai: Speech Recognition (in Japanese). Kyoritsu Shuppan Co., Ltd, 200 (1995)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      1994 研究成果報告書概要
  • [文献書誌] 菅野俊夫: "雑音劣化音声の一般化ケプストラムモデル化における事前情報の利用" 電子情報通信学会論文誌. J77-A. 945-953 (1994)

    • 関連する報告書
      1994 実績報告書
  • [文献書誌] 徳田恵一: "適応メルケプストラム分析を利用した音声符号化とその評価" 電子情報通信学会論文誌. J77-A. 1443-1452 (1994)

    • 関連する報告書
      1994 実績報告書
  • [文献書誌] 古市千枝子: "話音独立な特徴パラメータを用いた英語連続音声の音素セグメンテーションシステム" 電子情報通信学会論文誌. J78-A. (1995)

    • 関連する報告書
      1994 実績報告書
  • [文献書誌] Ming-Shen WANG: "A New Approach of Parsing and Speech Based on the Divide and Conguer Strategy for Continnois Speech Recognition" IEICE Trans.on Information and Systems. E78-D. (1995)

    • 関連する報告書
      1994 実績報告書
  • [文献書誌] 胡 力游: "中国語連続音声の声調認識" 電子情報通信学会論文誌. J78-A. (1995)

    • 関連する報告書
      1994 実績報告書
  • [文献書誌] 菅野俊夫: "Generalized Cepstral Modeling of Degraded Speech and its Application to speech Enhancement" IEICE Trans.Fundamentals. E76-A. 1300-1307 (1993)

    • 関連する報告書
      1993 実績報告書
  • [文献書誌] 鈴木良弥: "体系的な意味カテゴリーで記述された係り受け関係を利用する日本語文音声認識" 電子情報通信学会論文誌D-II. J76-D-II. 2264-2273 (1993)

    • 関連する報告書
      1993 実績報告書
  • [文献書誌] 今井 聖: "並列音素ラベリング(PPL)方式による話者独立単語音声認識システム" 電子情報通信学会論文誌A. J77-A. 143-152 (1994)

    • 関連する報告書
      1993 実績報告書
  • [文献書誌] 今井 聖: "信号処理工学" コロナ社(テレビジョン学会編), 201 (1993)

    • 関連する報告書
      1993 実績報告書

URL: 

公開日: 1993-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi