研究概要 |
音声分析・合成モデルに基づく複合補聴処理の開発を行った。本方式は、従来、単独で行われてきた様々な補聴処理を音声研究成果をベースとして、一連の処理ルーチンの中で選択的あるいは同時に処理可能な新たな補聴処理である。 11年度は、全体処理アルゴリズムの理論的検討並びにその構成要素の検討を行った.特に,ピッチ変換に伴う自然性改善のための高域スペクトルの周波数軸伸縮処理・スペクトルレベル圧縮について計算機シミュレーションと聴取実験により、その効果を確認した。結果として、自然性を損なわない範囲での声質変換補聴処理のために必要な周波数軸伸縮係数をピッチ変換係数の関数として定めることが可能となつた。 12年度は,主として「話速変換方式」の検討を行い,時間軸において大局的及び局所的変換を自由に設定できるアルゴリズムを見出すことができた。また,本手法は、音声ケプストラム分析を基盤として用いていることから、安定なピッチ抽出と有声・無声・無音の判別アルゴリズムの可否が再合成補聴音声の品質を左右する問題であり,この判別アルゴリズムについても研究を行った。 さらに,今後の評価実験他に供するためにWINDOWS上で動作する評価システムの構築を行った.本システムにより,パラメータ変更がら補聴音声の再生まで,オンラインで行うことが可能となった. 計算機シミュレーションによる処理アルゴリズムの検討は上記のようにほぼ終了したが,最終目標である本複合処理の実時間処理のための装置化が課題として残された.今後の課題として,DSP (Digital Signal Processor)を主体にした信号処理基板とそのプログラム開発のためのソフトウェアツール(研究費により購入済み)を用いて,実時間処理・装置化の問題に取り組む予定である.
|