研究概要 |
本研究の目的は,発音・発声障害者の不明瞭な音声を健常者に近い明瞭な音声へ自動変換するシステムを,ソフトコンピューティング技術を用いて開発し,障害者の音声コミュニケーションの手段を確立することである.本研究では,たえず騒音や雑音が存在する実騒音環境を想定し,周囲環境騒音の中で被験者の音声を,環境騒音に遮られることなく音声信号を摂取する方法として,骨導マイクを採用することにした.しかしながら通常,骨導音声(骨導マイクで収録した音声)は気導音声(通常のマイクで収録した音声)に比べると音質がいちじるしく劣化する.そのため,本年度はその音質改善のために,次の2つの実験を行った. 1.自己組織化マップによる骨導音声の音質改善に関する実験 被験者の片耳に,周辺雑音が混入しない片耳装着型骨導マイクを装着し,申請者らが開発した双子型自己組織化マップを用いて,骨導音声の音質を気導音声並みの音質へ改善した. 2.局所音声変換モデルによる骨導音声の音質改善に関する実験 骨導マイクにより収録した骨導音声の各フレームごとのメルケプストラム係数を,ニューラル・ガス・ネットワークによりクラスタリングを行い,それぞれのクラスごとに構成された局所音声変換モデルにより,高精度に気導音声へ変換した. 従来の周波数領域におけるフィルタリング法やマッピングコードブックを用いた方法などと本手法を比較し,本手法による変換音声は,量子化歪が少ないことを確認した.
|