• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

ニューラルネットワークを用いた音声信号の極低ビット符号化システムの開発

Research Project

Project/Area Number 06750409
Research Category

Grant-in-Aid for Encouragement of Young Scientists (A)

Allocation TypeSingle-year Grants
Research Field System engineering
Research InstitutionTohoku University

Principal Investigator

木幡 稔  東北大学, 工学部, 助教授 (30186720)

Project Period (FY) 1994
Project Status Completed (Fiscal Year 1994)
Budget Amount *help
¥1,100,000 (Direct Cost: ¥1,100,000)
Fiscal Year 1994: ¥1,100,000 (Direct Cost: ¥1,100,000)
Keywordsリカレントニューラルネットワーク / 音声符号化 / 情報圧縮 / 線形予測分析 / スペクトルパタン
Research Abstract

本研究では,時間変化パタンの記憶・再生能力を持つリカレントニューラルネットワークを音声スペクトルパタンの補間に用いた極低ビット符号化方式を提案した.提案方法について,連続音声から得られた時間変化スペクトルパタンを用いて,リカレントニューラルネットワークを学習させる際の最適学習方法を検討し,必要なパーセプトロン数,補間可能なパタン数などの定量的評価を計算機シミュレーションにより検討を行なった.
(社)日本音響学会の連続音声データベースから学習パタンを作成し,これを線形予測係数の1つであるLSP係数に変換し,これを対象として実験を行なった.
リカレントニューラルネットワークの学習は通時的誤差逆伝播法を用いて行なった.この際,似通ったパタンを予め分類しクラスタ化して複数の(4個程度)リカレントニューラルネットワークにより並列的に処理することが有効であることが分かった.またリカレントンニューラルネットワークを構成するパーセプトロンの数は10次のLSP係数の場合,50程度必要であることが分かった.また,補間可能なパタン数は,パタンの幾何学的な分散の大きさに依存し,分散が10%程度では約100個のパタンの補間処理が可能であることが分かった.最終的に補間,符号化後の音声のスペクトル歪は4.33dBで,伝送レートとして80.6bpsを得た.これは,線形補間,スプライン補間を用いた場合と比較して若干小さい歪であった.

Report

(1 results)
  • 1994 Annual Research Report
  • Research Products

    (1 results)

All Other

All Publications (1 results)

  • [Publications] 木幡 稔: "RNN補間器による音声スペクトルパタンの符号化" 電子情報通信学会技術研究報告. SP94-11. 39-46 (1994)

    • Related Report
      1994 Annual Research Report

URL: 

Published: 1994-04-01   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi