• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2017 Fiscal Year Annual Research Report

Omni-binaural recording system for high realistic sound field creation

Research Project

Project/Area Number 15K00235
Research InstitutionMeijo University

Principal Investigator

西野 隆典  名城大学, 都市情報学部, 教授 (40329769)

Project Period (FY) 2015-04-01 – 2018-03-31
Keywords立体音響 / バイノーラル録音 / 多聴点音響信号の統合 / くぼみ付き球状マイクロホンバッフル / 多視点映像 / 深層学習 / 音源定位モデル
Outline of Annual Research Achievements

複数の半球状のくぼみを有する球状マイクロホンバッフルを用い,360°画像に代表される多視点映像に対応した立体音を付与するための全方向バイノーラル録音装置と,立体音響信号の生成法の検討を行った。
本年度得られた成果は,1) 複数のくぼみ内で観測される音響信号の統合方法の改良,2) 生成される立体音響信号の評価に向けた音像定位モデルの検討である。
これまでに線形関数と3次スプライン関数を用いた加重平均を取る音響信号の統合方法を提案した。本年度はこれらに加え,べき関数,三角関数による重み係数の導入,ならびに3次スプライン関数の制御点を変更し,比較検討を行った。多視点映像の視聴では,音源を常に視線方向に位置させるように視聴するという仮定の下では,線形関数,3次スプライン関数,三角関数が平均スペクトル歪 3 dB 程度の良好な統合精度を達成した。さらに,視線方向に音源が位置しない条件下では,3次スプライン関数,三角関数を用いた場合に良好な精度を得た。これらの結果,本システムでは,3次スプライン関数,ならびに三角関数を用いた重み係数の利用が適切であることが示された。
また,生成した音響信号の評価には,主観評価実験を行うことが適当であると考えられるが,主観評価は被験者の時間的,身体的な負担が大きい。そのため,機械による代替が可能か基礎的な検討を進めた。音像定位モデルには深層学習を導入し,評価を行った。結果から,学習データと音響的性質が近い評価データは,95 % 以上の音像定位正解率を得たが,残響時間の違いなど音響的性質が異なる評価データを用いた場合に,音像定位正解率は 35 % 程度となった。また,左右の混同がみられるなど,人間による音像定位結果とは異なる定位結果も現れたことから,主観評価を機械で代替するためには,学習データやネットワーク構造など多くの検討課題があることが明らかとなった。

  • Research Products

    (10 results)

All 2018 2017 Other

All Journal Article (3 results) (of which Peer Reviewed: 3 results,  Open Access: 1 results) Presentation (6 results) Remarks (1 results)

  • [Journal Article] Development of a cylindrical omni-binaural recording system for 360-degree videos2018

    • Author(s)
      Takanori Nishino, Kento Imamura, Taishi Nakagiri, and Kenta Niwa
    • Journal Title

      Acoustical Science and Technology

      Volume: 39 Pages: -

    • Peer Reviewed / Open Access
  • [Journal Article] 畳み込み雑音除去自己符号化器と対数周波数領域スペクトル特徴を用いた楽曲音源強調2018

    • Author(s)
      大谷健登, 丹羽健太, 西野隆典, 武田一哉
    • Journal Title

      電子情報通信学会論文誌

      Volume: J101-D Pages: 615-627

    • Peer Reviewed
  • [Journal Article] 運筆音を用いた記述者識別2018

    • Author(s)
      朝倉大智, 西野隆典, 成瀬央
    • Journal Title

      日本音響学会誌

      Volume: 74 Pages: 14-16

    • Peer Reviewed
  • [Presentation] 全方位映像に対応した立体音生成のための音響信号統合方法の検討2017

    • Author(s)
      今村健人, 西野隆典, 成瀬央
    • Organizer
      電子情報通信学会応用音響研究会
  • [Presentation] 署名運筆音を用いた記述者識別の検討2017

    • Author(s)
      朝倉大智, 西野隆典, 成瀬央
    • Organizer
      電子情報通信学会応用音響研究会
  • [Presentation] 楽器音生成過程を考慮した畳み込みニューラルネットワークに基づく楽曲音源強調2017

    • Author(s)
      大谷健登, 丹羽健太, 西野隆典, 武田一哉
    • Organizer
      日本音響学会2017年秋季研究発表会
  • [Presentation] 運筆音を用いた記述者識別における記述者モデル数の影響の調査2017

    • Author(s)
      朝倉大智, 西野隆典, 成瀬央
    • Organizer
      日本音響学会2017年秋季研究発表会
  • [Presentation] 複数くぼみを持つマイクロホンバッフルにおける立体音響信号の統合の検討2017

    • Author(s)
      今村健人, 西野隆典, 成瀬央
    • Organizer
      平成29年度電気・電子・情報関係学会東海支部連合大会
  • [Presentation] 運筆音による記述者識別における記述者モデル数の影響の調査2017

    • Author(s)
      朝倉大智, 西野隆典, 成瀬央
    • Organizer
      平成29年度電気・電子・情報関係学会東海支部連合大会
  • [Remarks] 360° video with binaural sound

    • URL

      https://youtu.be/VF2pHLZClw8

URL: 

Published: 2018-12-17  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi