音声の長時間位相スペクトルを利用した画像の音変換に関する研究

研究課題

研究課題/領域番号	17K00234
研究種目	基盤研究(C)
配分区分	基金
応募区分	一般
研究分野	知覚情報処理
研究機関	京都産業大学 (2018-2020) 大阪大学 (2017)
研究代表者	川村新京都産業大学, 情報理工学部, 教授 (60362646)
研究期間 (年度)	2017-04-01 – 2021-03-31
研究課題ステータス	完了 (2020年度)
配分額 *注記	3,510千円 (直接経費: 2,700千円、間接経費: 810千円) 2019年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円) 2018年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円) 2017年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
キーワード	画像の音変換 / スペクトログラム / 位相スペクトル / 長時間フーリエ変換 / 反復位相復元 / 情報システム / 画像 / 音声等認識 / 情報通信工学
研究成果の概要	音声をフーリエ変換し，角周波数の振幅スペクトルを輝度として，時間方向に並べた画像をスペクトログラムと呼ぶ．本研究では，一般的な画像を音声のスペクトログラムに埋め込み，音声を合成する方法について検討した．画像をスペクトログラムに埋め込むと，音声の振幅スペクトルが失われる．しかし，音声の長時間位相スペクトルを利用すれば，明瞭度のある音声を合成することができる．そこで提案法では，画像を振幅スペクトル，音声を位相スペクトルに対応させることで，画像から明瞭度のある音声を合成した．提案法では，合成音声から埋め込み画像を復元する際に，一般の情報埋め込み技術とは異なり，振幅スペクトルそのものが画像を表現する．
研究成果の学術的意義や社会的意義	本研究では，画像を埋め込んだ合成音声をスピーカ等から放射し，受信側で音声から画像を復元する．この技術が完成すれば，音声から得られる言葉の情報とともに，画像情報も同時に伝達できる．また，WiFi環境が整備されていない場所でも受信が可能となり，受信可能範囲も，スピーカの音量調整により制御可能となる．応用例は多岐にわたり，防災用スピーカからの緊急放送に避難経路や災害現場の写真を埋め込む，ラジオの天気予報に天気図を埋め込む，絵本の読み聞かせに該当ページの絵を埋め込む，タイムセール放送に商品や売り場の地図を埋め込む，海外のバスや電車の音声アナウンスに翻訳情報を埋め込む，などが考えられる．

報告書

(5件)

研究成果
(5件)

すべて 2020 2018 2017

すべて雑誌論文 (3件) (うち国際共著 2件、査読あり 3件) 学会発表 (2件) (うち国際学会 1件)

[雑誌論文] An Efficient Image to Sound Mapping Method Preserving Speech Spectral Envelope2020
- 著者名/発表者名
  HOSODA Yuya、KAWAMURA Arata、IIGUNI Youji
- 雑誌名
  
  IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences
  
  巻: E103.A 号: 3 ページ: 629-630
- DOI
  10.1587/transfun.2019EAL2139
- NAID
  130007803998
- ISSN
  0916-8508, 1745-1337
- 年月日
  2020-03-01
- 関連する報告書
  2019 実施状況報告書
- 査読あり
[雑誌論文] On Sound Signal Processing in Image to Sound Mapping Technique2017
- 著者名/発表者名
  Arata Kawamura
- 雑誌名
  
  Elsevier Applied Acoustics
  
  巻: 117 ページ: 1-11
- 関連する報告書
  2017 実施状況報告書
- 査読あり / 国際共著
[雑誌論文] An efficient image to sound mapping method using speech spectral phase and multi-column image2017
- 著者名/発表者名
  Arata Kawamura, Hiro Igarashi, and Youji Iiguni
- 雑誌名
  
  IEICE Trans. Fundamentals
  
  巻: E100-A ページ: 893-895
- NAID
  130005397016
- 関連する報告書
  2017 実施状況報告書
- 査読あり / 国際共著
[学会発表] 反復位相復元を利用した音声スペクトログラムへの画像埋め込み2020
- 著者名/発表者名
  川村新
- 学会等名
  電子情報通信学会　信号処理研究会　技術報告会資料
- 関連する報告書
  2019 実施状況報告書
[学会発表] Image-to-sound transformation using inpainting technique2018
- 著者名/発表者名
  Yuya Hosoda, Arata Kawamura, and Youji Iiguni
- 学会等名
  The 2018 International Symposium on Nonlinear Theory and its Applications
- 関連する報告書
  2018 実施状況報告書
- 国際学会

音声の長時間位相スペクトルを利用した画像の音変換に関する研究

研究代表者

川村 新 京都産業大学, 情報理工学部, 教授 (60362646)

3,510千円 (直接経費: 2,700千円、間接経費: 810千円)

報告書

研究成果

[雑誌論文] An Efficient Image to Sound Mapping Method Preserving Speech Spectral Envelope2020

著者名/発表者名

雑誌名

DOI

NAID

ISSN

年月日

関連する報告書

[雑誌論文] On Sound Signal Processing in Image to Sound Mapping Technique2017

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] An efficient image to sound mapping method using speech spectral phase and multi-column image2017

著者名/発表者名

雑誌名

NAID

関連する報告書

[学会発表] 反復位相復元を利用した音声スペクトログラムへの画像埋め込み2020

著者名/発表者名

学会等名

関連する報告書

[学会発表] Image-to-sound transformation using inpainting technique2018

著者名/発表者名

学会等名

関連する報告書

川村新京都産業大学, 情報理工学部, 教授 (60362646)