研究概要 |
一般に,船舶のエンジンルームや空港の駐機場などの特殊な高騒音環境においては,周りの騒音の影響が防止できる骨伝導マイク(発話時における話者の顎骨の振動を検知し,それを音に変換する特殊なマイク)が用いられる.しかし,これは発話者の顎骨の振動を音に変換するため,ざらつき感のある耳障りな音質であり,聞き取りが非常に難しい.本研究では,この骨導音声を通常の気導音声(一般のマイクから受音した音声)の音質に変換するアルゴリズムを開発し,高騒音下における作業員同士や作業員と指令センターとのスムーズな音声コミュニケーションの手段を確立する.本年度の研究実績は以下のとおりである. 1.スパースコーディングを用いたコードブックの圧縮と双子型自己組織化マップアルゴリズムの完成 昨年度までは,音声のスペクトル情報そのもの,フォルマント情報,音声スペクトル包絡の大局的情報を含むLPC係数などを特徴ベクトルに選び,これらを用いて音声変換のコードブックを構成した.その後,双子型自己組織化マップにより,骨導音声から気導音声への音声変換を実現した.しかし,これらの音声スペクトルに関する情報を特徴ベクトルに選ぶと,コードブックサイズが大きくなり,実応用に問題が生じる.本年度は,ヒトの視覚系で知られているスパースコーディング(たくさんのニューロンのうち,ごく少数のニューロンが発火するパターンコーディング)を本コードブック形成に応用し,コードブックサイズの圧縮を図った.また,双子型自己組織化マップを用いた骨導音声から気導音声への音声変換アルゴリズムを完成させた. 2.双子型自己組織化マップの他分野への応用可能性の検討 本研究で開発した双子型自己組織化マップは,音声変換を含め様々な非線形写像を実現できることがわかった.昨年度は,画像拡大にも応用可能であることがわかったが,今年度は,更に他分野への応用可能性を検討した.
|