研究概要 |
音声分析・合成モデルに基づく複合補聴処理のソフトウエアの開発を行った。本方式は、従来、単独で行われてきた様々な補聴処理を音声分野での研究成果をベースとして、一連の処理ルーチンの中で選択的あるいは同時に処理可能な新たな補聴処理である。ケプストラム領域でのスペクトルレベル圧縮処理,声質変換におけるピッチ変換に伴う自然性改善のための高域スペクトルの周波数軸伸縮処理及び話速変換処理について計算機シミュレーションと聴取実験により、その効果の確認を行った。結果として、自然性を損なわない範囲での声質変換補聴処理のために必要な周波数軸伸縮(低域での線形伸縮、高域での非線形伸縮)係数をピッチ変換係数の関数として定めることが可能となった。更に、話速変換においては、時間軸において大局的及び局所的変換を自由に設定できるアルゴリズムを見出すことができた。本手法は、音声ケプストラム分析を基盤として用いていることから、安定なピッチ抽出と有声・無声・無音の判別アルゴリズムの可否が、再合成補聴音声の品質を左右する問題であり,この判別アルゴリズムの検討を行い,ほぼ満足できる結果を得た.実用化へ向けたDSP処理に基づく装置化までは現段階では至っていないが,現在計算機シミュレーションで得られたソフトウエアをDSPプログラムへ移植を行っており,これが終了次第フィールド試験を実施していく予定である.
|