2005 Fiscal Year Annual Research Report
Project/Area Number |
15500137
|
Research Institution | Yamaguchi University |
Principal Investigator |
内野 英治 山口大学, 理学部, 教授 (30168710)
|
Co-Investigator(Kenkyū-buntansha) |
末竹 規哲 山口大学, 理学部, 助教授 (80334051)
矢野 和昭 弓削商船高等専門学校, 情報工学科, 講師 (50259959)
|
Keywords | 高騒音 / 音声コミュニケーション / 骨導音声 / 気導音声 / 音声変換 / コードブック / 双子型SOM / 自己組織化ネットワーク |
Research Abstract |
一般に,特殊な環境,例えば,船舶のエンジンルームや空港の駐機場などの高騒音下においては,周りの騒音の混入が防止できる骨伝導マイク(発話時における話者の顎骨の振動を検知し,それを音に変換する特殊なマイク)が用いられる.しかし,これは発話者の顎骨の振動を音に変換するため,ざらつき感のある耳障りな音質であり,慣れないと聞き取りが非常に困難である.そこで,本研究では,この骨導音声を通常の気導音声(一般のマイクから受音した音声)の音質に変換するアルゴリズムを開発し,高騒音下における作業員同士や作業員と指令センターとの音声コミュニケーションがスムーズに行える通信手段を確立する.本年度の研究実績は以下のとおりである. 1.本音声変換手法の優位性の確認および改良 本音声変換手法の優位性を確認すべく,従来型のニューラルネットワークや自己組織化マップを用いた音声変換結果と比較し,本手法の有効性を確認すると共に,本手法が他手法に比べ,ハードウェア化に適した手法であることを確認した.また改良として,音声スペクトル包絡の大局的情報を含むLPC係数を特徴ベクトルに選び,コードブックの圧縮を図った. 2.画像拡大への応用 本音声変換手法に用いたコードブックの考え方が,画像拡大にも応用可能であることがわかった.コードブックを用いて画像を拡大し,通常拡大画像に見られるギザの少ない,より鮮明な画像が得られた.これは,本手法から派生した画像の有効な拡大法である.
|