研究概要 |
本研究では,音声符号化においてこれまで用いられてきたAbS型の符号化が,音質を維持しつつビットレートを削減するには限界に達している問題を解決するために,聴覚特性を利用したボコーダ型の1.2kbps極低ビット音声符号化方式を新たに提案した.提案方式はLPCボコーダと同程度の情報を用いながら,その音質を良好なものとするために,いわゆるHarmonic codingの手法を採用し,その振幅成分を聴覚フィルタを用いて適応的に変調するものである.本研究では,聴覚フィルタの1つであるGammatoneフィルタを用いてharmonicsを変調する方法を提案し極低ビット化と音質維持を両立させることに成功した.また,音源信号の位相に関しても聴感特性を考慮した変調方法を提案し,主観的音質を向上させることができた.符号化音声の音質評価のために主観評価実験を行った結果,提案方法による合成音声の音質は,1.2kbpsのLPCボコーダのそれと比較してプリファレンススコアで37.5%,MOS値で0.45改善され,また2.4kbpsのMELP方式と比較して同程度の主観的音質が得られることが確認された.以上の成果により,1.2kbit/sにおいて音声符号化を行うことが可能となったが,さらに音質を改善するために精度の高いピッチ抽出方法を実装した.また,Gammatoneフィルタと同様の処理が可能でありながら,構成がより単純で,スペクトル整形を行うためのパラメータ調整を試行錯誤的に行うことができるフィルタとして聴感重みづけフィルタを南い,Gammatoneフィルタの替わりにスペクトルの整形処理を行った結果,この2つの改善前の音声と比較してMOS値で0.87改善することができた.
|