研究概要 |
一般に,特殊な環境,例えば,船舶のエンジンルームや空港の駐機場などの高騒音下においては,周りの騒音の混入が防止できる骨伝導マイク(発話時における話者の顎骨の振動を検知し,それを音に変換する特殊なマイク)が用いられる.しかし,これは発話者の顎骨の振動を音に変換するため,ざらつき感のある耳障りな音質であり,慣れないと聞き取りが非常に困難である.そこで,本研究では,この骨導音声を通常の気導音声(一般のマイクから受音した音声)の音質に変換するアルゴリズムを開発し,高騒音下における作業員同士や作業員と指令センターとの音声コミュニケーションがスムーズに行える通信手段を確立する.本年度の研究実績は以下のとおりである. 1.本音声変換手法の優位性の確認および改良 本音声変換手法の優位性を確認すべく,従来型のニューラルネットワークや自己組織化マップを用いた音声変換結果と比較し,本手法の有効性を確認すると共に,本手法が他手法に比べ,ハードウェア化に適した手法であることを確認した.また改良として,音声スペクトル包絡の大局的情報を含むLPC係数を特徴ベクトルに選び,コードブックの圧縮を図った. 2.画像拡大への応用 本音声変換手法に用いたコードブックの考え方が,画像拡大にも応用可能であることがわかった.コードブックを用いて画像を拡大し,通常拡大画像に見られるギザの少ない,より鮮明な画像が得られた.これは,本手法から派生した画像の有効な拡大法である.
|