話者正規化による高精度多数話者単語音声認識システムとそのLSI化に関する研究
Project/Area Number |
03555070
|
Research Category |
Grant-in-Aid for Developmental Scientific Research (B)
|
Allocation Type | Single-year Grants |
Research Field |
情報工学
|
Research Institution | The University of Tokyo |
Principal Investigator |
広瀬 啓吉 東京大学, 工学部, 助教授 (50111472)
|
Co-Investigator(Kenkyū-buntansha) |
市川 憙 (株)日立製作所, 中央研究所, 主任研究員
森川 博由 東京大学, 工学部, 講師 (40011217)
|
Project Period (FY) |
1991
|
Project Status |
Completed (Fiscal Year 1991)
|
Budget Amount *help |
¥4,200,000 (Direct Cost: ¥4,200,000)
Fiscal Year 1991: ¥4,200,000 (Direct Cost: ¥4,200,000)
|
Keywords | 経路限定DP照合法 / 話者正規化法 / マルチテンプレ-ト方式 / 多数話者単語音声認識システム / LSI化 / DSP / シストリックアレイ / 論理設計 |
Research Abstract |
本研究は、経路限定DP照合法と母音音声を用いた特徴パラメ-タの話者正規化法とを従来のマルチテンプレ-ト方式に組合せ、高精度の多数話者単語音声認識システムを計算機上に構築し、その性能評価を行うこと、さらにLSI化を検討し、小型装置として実現するための方策を示すことを目的とするもので、以下の実績をあげた。 (1)従来の話者正規化法は孤立発声した母音音声のみを用いていたが、無声摩擦音を利用するアルゴリズムを開発し、その有効性を確認した。さらに、単語中で発声された母音音声を正規化に用いることの検討を加えた。 (2)経路限定DP照合法、話者正規化法、フレ-ム数正規化法のアルゴリズムをワ-クステ-ション上に実装するとともに、modified K-means法によって男女各10名ずつの音声デ-タから1単語当り4個の標準パタ-ンを選定して、ハ-ドディスク装置に格納した。このようにして単語音声認識システムをワ-クステ-ション上に構築して認識実験を行ない、方式の有効性を確認するとともに、方式のパラメ-タ値の最適化をはかった。 (3)パラメ-タの抽出、話者正規化のパラメ-タ変換、経路限定点候補の検出、フレ-ム数正規化をDSPで、標準パタ-ンと入力パタ-ンとのDP照合をシストリックアレイで行なう単語音声認識ボ-ドの処理の流れを明らかにし、ボ-ドの基本的な構成を示した。 (4)距離計算と経路計算の機能を有するシストリックアレイの処理素子の論理設計を行なった。さらに、このような素子38個からなるDP照合プロセッサのデ-タの流れの制御について検討した上で、論理設計を行ない、計算機シミュレ-ションにより動作の確認を行なった。 以上、交付申請書に記載された研究計画はほぼ予定通りに達成した。
|
Report
(1 results)
Research Products
(2 results)