研究概要 |
一般に,特殊な環境,例えば,船舶のエンジンルームや空港の駐機場などの高騒音下においては,周りの騒音の混入が防げる骨伝導マイク(発話時における話者の顎骨の振動を検知し,それを音に変換する特殊なマイク)が用いられる.しかし,これは発話者の顎骨の振動を音に変換するため,ざらつき感のある耳障りな音質であり,聞き取りがかなり困難である.そこで,本研究では,この骨導音声を通常の気導音声(一般のマイクから受音した音声)の音質に変換するアルゴリズムを開発し,高騒音下における作業員同士や作業員と指令センターとの音声コミュニケーションがスムーズに行える手段を確立する.本年度の研究実績は以下のとおりである. 1.船舶のエンジンルーム内会話への適用 昨年度行った研究により,双子型自己組織化マップが,非線形の入出力関係を効率的に学習し,骨導音声(入力)から気導音声(出力)への非線形写像を正確に表現出来ることがわかった.本年度は,実際の現場(船舶のエンジンルーム)で使用される音声を用いて,本変換アルゴリズムの有効性を検証すると共に,船舶のエンジンルーム内での会話に限定し,音声変換の性能向上を図った、 2.構造化学習kMER 自己組織化マップの一種として,等確率位相マップを実現するカーネルベース最大エントロピ学習規則(kMER)がある.本年度は,kMERのネットワーク構造を最適化する構造化学習kMERを提案し,その有効性を確認した.今後は,これを応用した双子型自己組織化マップの構造学習法を検討する. 3.スペクトル辞書による耐雑音音声復元 音声の明瞭さを保ちながら,音声に重畳した雑音を効率的に除去することを目的に,スペクトル情報辞書を用いた耐雑音音声復元法を提案した.今後は,双子型自己組織化マップによる変換後音声の音質改善への応用を検討する.
|