研究課題/領域番号 |
17K00234
|
研究機関 | 京都産業大学 |
研究代表者 |
川村 新 京都産業大学, 情報理工学部, 教授 (60362646)
|
研究期間 (年度) |
2017-04-01 – 2021-03-31
|
キーワード | 長時間フーリエ変換 / 画像の音変換 / 位相スペクトル |
研究実績の概要 |
本研究では,音声に画像を埋め込み,実環境で放射,そして受信した音声信号から画像を復元する手法を検討している.本手法は,音声の長時間フーリエ変換で得られた位相スペクトルで音声らしさを保持し,振幅スペクトルに画像を埋め込む. 今年度は,昨年度に引き続き,実環境における復元画像の歪みについての検証と,効率的な画像埋め込み法の検討を実施した.昨年度の結果から,残響のある環境において,画像を埋め込んだ音声を放射し,これを受信して画像を復元すると,復元画像が激しく劣化することが確認できた.逆に,画質を保持するために,音声スペクトルを削ると,音質が劣化するというトレードオフが生じる.そこで,音声や音楽信号などが,基本周波数とその倍音で構成されることを考慮し,パワーの強い音声スペクトルを保持し,音質にあまり寄与しないスペクトルのみに画像を埋め込む方法に切り替えた.また,簡単な画像補間技術を導入することで,復元画像の画質を改善する方法を提案した.本結果は,学術雑誌に投稿し,採択された. 次に,音質劣化をさらに抑制するために,サンプリング周波数を44.1kHz以上に高くして,およそ19kHz以上の超音波に近い周波数帯域にのみ,画像を埋め込む方式を検討した.この際,画像を埋め込める領域は小さくなる.よって,画像の伝送時間が長くなる.そこで,オーバーラップ加算による,伝送時間単出についても検討を行った.オーバーラップ加算を行うと,画像および音質が両方劣化する.そこで,反復位相復元法と呼ばれる位相スペクトル復元法を導入し,これを改善した.本結果は2020年3月開催の会議で発表予定であったが,学会中止となり,関連研究者との議論ができないままとなっている.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
音声スペクトルに画像を埋め込む方式について,3年をかけて研究してきた.この間,いくつかの埋め込み方式が生まれ,学会発表などを通しての意見交換,他の研究成果や論文サーベイなどからのアイデアの取り込みにより,徐々に性能が改善されてきた.しかし,コロナウィルス対応により,今春,参加予定であった学会等が中止になった.また,学内での作業にも一部制限がかかり,研究遂行が遅れている.特に,新方式の実環境実験が実施できていない.このことから,期間延長を行い次年度成果報告を行う.
|
今後の研究の推進方策 |
音声のサンプリング周波数を高め,超音波に近い周波数帯域に画像を埋め込む方式について,実環境実験を行う.ただし,一般的なDA変換器では,超音波帯域における周波数歪みが生じやすくなり,スピーカ出力時点ですでに埋め込み画像が劣化している.そこで,高性能DA変換器を利用して,スピーカ出力を改善しながら,実環境における提案法の性能評価を行う.
|
次年度使用額が生じた理由 |
新型コロナウィルス対応により,参加予定であった学会等が中止になった.このことから,期間延長を行い次年度成果報告を行う.使用計画では,関連研究者と議論を行うための費用と,実験材料費の一部に使用する予定である.
|