本研究において、本年度は音声信号の処理を中心に研究を行ってきた。従来から音声認識に使用されている手法の一つとしてケプストラム法がある。研究代表者らもこの手法を基に雑音環境下の音声認識の研究を以前から行ってきている。ケプストラム法などの手法はフーリエ変換を基にした解析手法であるため周波数領域における解析が中心になり、時間領域に関しては二の次になっている。また、研究代表者らも雑音の影響によりスペクトラムの谷の部分が埋もれてしまう現象を規則的に谷をつけることにより回復する簡易的なスペクトラムサブトラクションのような手法により認識率の改善を行う研究を行ってきた。しかし、一フレームずつ規則的なスペクトルの変形を行うためフレーム間の情報は無視してきた。このためのフレーム方向に不自然なスペクトルとなってしまっていた。この改善方法として画像圧縮など画像処理に用いられるウェーブレット変換を用いて周波数およびフレームの両領域同時に平滑化を行うことにより改善を行い、認識率を向上させた。しかしまだ条件などにより認識率が向上しない場合があるなど改善の余地があり更なる研究が必要である。また、口の動きなどの画像情報による手法においては口の動きの情報を取り出し変化を見るなどの基礎的な検討を行った。しかし撮影環境や個人差などによる影響が大きく発表できるような手法の確立にいたっていないため更なる研究が必要である。 また本年度は、特に研究を行うための研究環境の整備を行った。研究を行っていくため、音声信号や画像信号の入出力システムの構築が必要不可欠であったため基本的な設備環境の整備を行った。これにより音声信号や画像信号をコンピュータへ取り込むことが可能となった。しかし、データ作成時などにおいて収録環境や収録方法などの更なる検討が必要となると考えられる。
|