研究概要 |
一般に,船舶のエンジンルームや空港の駐機場などの特殊な高騒音環境下においては,周りの騒音の影響が防止できる骨導マイク(発話時における話者の顎骨の振動を検知し,それを音に変換する特殊なマイク)が用いられる.しかし,これは発話者の顎骨の振動を音に変換するため,ざらつき感のある耳障りな音質であり,聞き取りが非常に難しい.本研究では,この骨導音声を通常の気導音声(一般のマイクから受音した音声)の音質に変換するアルゴリズムを開発し,高騒音下における作業員同士や作業員と指令センターとのスムーズな音声コミュニケーション手段の確立を目指した.本研究の成果は以下のとおりである. 1.双子型自己組織化マップによる音声変換 非線形の入出力関係を学習できる双子型自己組織化マップを完成させ,骨導音声から気導音声への変換に用いた.具体的には,骨導音声のコードブック(スペクトル情報)とそれに対応する気導音声のコードブック(スペクトル情報)間の非線形関係を,双子型自己組織化マップで学習し,入力された骨導音声からそれを気導音声へ変換するアルゴリズムを確立させた. 2.本音声変換手法の優位性の確認と船舶のエンジンルーム内会話への応用 本音声変換手法の結果を従来型のニューラルネットワークや自己組織化マップを用いた結果と比較し,本手法の優位性を確認すると共に,本手法が他手法に比べ,ハードウェア化に適した手法であることも確認した.また,実際の船舶のエンジンルーム内で使用される音声を用いて,本変換アルゴリズムの有効性を検証した. 3.他分野への応用可能性の検討 本音声変換手法で用いたコードブックの考え方を画像拡大に応用し,ギザの少ないより鮮明な拡大画像が得られることを確認した.また,本研究で開発した双子型自己組織化マップは,音声変換を含め様々な非線形写像を実現できる一般的な方法である.今後は更に他分野への応用可能性を検討したい.
|