• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

トップダウン処理とボトムアップ処理を併用した大語量単語音声認識に関する研究

研究課題

研究課題/領域番号 04680022
研究種目

一般研究(C)

配分区分補助金
研究分野 情報学
研究機関岩手大学

研究代表者

三輪 譲二  岩手大学, 工学部, 助教授 (60125664)

研究期間 (年度) 1992
研究課題ステータス 完了 (1992年度)
配分額 *注記
1,600千円 (直接経費: 1,600千円)
1992年度: 1,600千円 (直接経費: 1,600千円)
キーワード音声認識 / トップダウン処理 / ボトムアップ処理 / 大語彙単語 / 単語音声認識 / 音声データベース / パタン認識 / 音声
研究概要

本研究により得られた知見を、要約すると以下のようになる。
1.大語彙単語音声データベースの作成: 音素ラベルを音素表記と音声表記のどちらでもアクセスできるデータベースの重要性を示した。
2.シンプルな機構を持つ音素認識法の開発: 異なる時間の音素カテゴリの相互情報を利用するため、階層型音素認識ネットワーク素子による音素認識方式を提案した。特定話者認識実験より、94.1%の高い音素認識率となり、従来型と比較して/N/等の音素の認識率が改善され、異なる性質の事後確率系列が得られることを示した。
3.ボトムアップ処理による単語音声認識法の開発:3音素組コンテキストの音素混同行列を用いた方式を提案し、音素系列のマッチングによる方法であるため、認識性能が高く、高速処理が可能であり、単語の予備選択に有効であることを示した。
4.トップダウン処理による単語音声認識法の開発: 単語の仮説と事後確率系列による単語の検定により認識精度を高める方式は、入力音声の特徴に依存した検定が可能なため、認識性能向上に有効であることを示した。
5.大語彙単語音声認識実験: 5240単語の大語彙単語音声認識実験を行い、特定話者で84.4%の単語認識率を得ることができた。この実験から、性質の異なる事後確率系列を相加平均して用いることが有効であり、認識率と処理時間の観点から大語彙の単語音声認識には、トップダウン処理とボトムアップ処理を併用した本方式が有効であることを示した。
6.研究成果の公表: 本研究の成果を、日本音響学会の講演会および電子情報通信学会の音声研究会で口頭発表した。

報告書

(1件)
  • 1992 実績報告書
  • 研究成果

    (3件)

すべて その他

すべて 文献書誌 (3件)

  • [文献書誌] 今 誠紀: "階層型ネットワーク素子を用いた音素認識" 日本音響学会 秋季講演論文集. 3-1-1. 141-142 (1992)

    • 関連する報告書
      1992 実績報告書
  • [文献書誌] 今 誠紀: "音素事後確率の時間パターンを特徴とした音素認識" 電子情報通信学会 技術報告(音声). SP92-124. 1-8 (1993)

    • 関連する報告書
      1992 実績報告書
  • [文献書誌] 今 誠紀: "階層型音素認識ネットワーク素子を用いた単語音声認識" 日本音響学会 春季講演論文集. 2Q23. 129-130 (1993)

    • 関連する報告書
      1992 実績報告書

URL: 

公開日: 1992-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi