• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2016 Fiscal Year Annual Research Report

非同期分散チャンネルへ展開するアレイ信号処理理論の深化と実世界応用

Research Project

Project/Area Number 16H01735
Research InstitutionNational Institute of Informatics

Principal Investigator

小野 順貴  国立情報学研究所, 情報学プリンシプル研究系, 准教授 (80334259)

Co-Investigator(Kenkyū-buntansha) 牧野 昭二  筑波大学, 生命領域学際研究センター, 教授 (60396190)
猿渡 洋  東京大学, 大学院情報理工学系研究科, 教授 (30324974)
小山 翔一  東京大学, 大学院情報理工学系研究科, 助教 (80734459)
Project Period (FY) 2016-04-01 – 2020-03-31
Keywords非同期 / 分散 / マイクアレー / 音源定位 / マイク定位 / 音源分離
Outline of Annual Research Achievements

1) 到来時間差に基づくマイク・音源の同時位置推定法について引き続き研究を進め、成果をまとめた論文がトップジャーナルに掲載された。2) 到来時間差に基づくマイク・音源の同時位置推定法について引き続き研究を進め、成果をまとめた論文がトップジャーナルに掲載された。また、メディアンフィルタを用いて実環境での位置推定をロバストに行う新しい手法を提案した。3) スマートフォンが音を発信することを利用し、録音機器間の距離とサンプリング周波数ミスマッチを同時に推定する手法を提案した。
4) 時間チャンネル領域での非負値行列因子分解を用いた振幅ベースの音声強調法が、同期ずれに頑健であること、また複数の遠方音源をまとめて除去できることを示した。5) 音響イベント検出のために、空間ケプストラムを発展させ、スペクトル特徴と空間情報を同時に表現する一般化空間ケプストラムという手法を提案した。この成果をまとめた論文がトップジャーナルに掲載された。また、基本的な音響イベント検出の性能向上のため、DNN-GMMと連結特徴量を用いる手法を提案した。
6) ブラインド同期の応用システムとして、複数台のiPhoneを用いた複数話者同時音声認識システムを構築し、認識性能を評価した。この成果をまとめた論文が音声分野のトップ会議に採録された。デモ動画も公開した。また、自閉症の音声収録、音声解析にも分散マイクアレーを応用した。7) 音源定位手法の性能向上のため、独立低ランク行列分析にスパース時系列正則化を行った場合の効率的な解放について検討した。またスパース性を利用した高速化について検討した。8) 音源強調手法の性能向上のため、ヴァーチャル多素子化に基づく SN 比最大化ビームフォーマの残響に対する性能変化について調査した。9) 分散スピーカアレイにも適用可能な音場再現手法を導出し、その有用性を確認した。

Current Status of Research Progress
Current Status of Research Progress

1: Research has progressed more than it was originally planned.

Reason

学術的な成果としては、ジャーナル論文6編(うち3編はIEEE Trans.のトップジャーナル論文)、国際会議論文9編(うち5編は、ICASSP, INTERSPEECH, EUSIPCOというトップ会議論文)、国内学会発表8件が得られた。また、国内では音声研究会で招待講演を行い、フランスのTelecom Paristechでも非同期マイクアレーに関するトークを行った。複数話者同時音声認識については、筑波大学と共同でプレスリリース(http://www.nii.ac.jp/news/2016/0929/)を行い、関連して小野が朝日新聞3月12日朝刊35面に取材協力を行ったり、JST Science Window 2017春号 p.18に取り上げられるなど、波及して複数メディアに取り上げられるなど、計画以上の大きな成果が生まれたため。

Strategy for Future Research Activity

1) サンプリング周波数ミスマッチを時間周波数領域での時変位相回転として定式化し、非同期アレイの同期化と音源分離を統一的な目的関数により行う非同期アレー信号処理理論の定式化を行う。2) 非同期マイクアレーの応用システムの一つである、複数話者同時音声認識システムについて評価を進め、ジャーナル論文としての出版を目指す。3) 時間チャンネル領域での非負値行列因子分解による音源強調について、スペクトル情報も利用した手法への拡張を検討する。4) 音源分離性能の基本的な向上を目的に、ヴァーチャル多素子化によるアレイ信号処理についても検討を進める。

Remarks

(1)は本科研成果により得られたプレスリリース

  • Research Products

    (26 results)

All 2017 2016 Other

All Int'l Joint Research (2 results) Journal Article (15 results) (of which Int'l Joint Research: 2 results,  Peer Reviewed: 15 results,  Acknowledgement Compliant: 12 results,  Open Access: 3 results) Presentation (8 results) (of which Invited: 1 results) Remarks (1 results)

  • [Int'l Joint Research] Technical University of Liberec(チェコ)

    • Country Name
      CZECH
    • Counterpart Institution
      Technical University of Liberec
    • # of Other Institutions
      1
  • [Int'l Joint Research] Conexant System(米国)

    • Country Name
      U.S.A.
    • Counterpart Institution
      Conexant System
  • [Journal Article] Spatial Cepstrum as a Spatial Feature Using Distributed Microphone Array for Acoustic Scene Analysis2017

    • Author(s)
      Keisuke Imoto and Nobutaka Ono
    • Journal Title

      IEEE/ACM Trans. Audio, Speech and Language Processing

      Volume: 25 Pages: 1335-1343

    • DOI

      10.1109/TASLP.2017.2690559

    • Peer Reviewed
  • [Journal Article] 教師信号を用いた非同期分散型マイクロホンアレーによる音源分離2017

    • Author(s)
      坂梨 龍太郎, 小野 順貴, 宮部 滋樹, 山田 武志, 牧野 昭二
    • Journal Title

      日本音響学会論文誌

      Volume: 73 Pages: 337-348

    • Peer Reviewed
  • [Journal Article] Closed-Form Solutions for TDOA-based Joint Source and Sensor Localization2017

    • Author(s)
      Trung-Kien Le and Nobutaka Ono
    • Journal Title

      IEEE Trans. Signal Processing

      Volume: 65 Pages: 1207-1221

    • DOI

      10.1109/TSP.2016.2633784

    • Peer Reviewed / Acknowledgement Compliant
  • [Journal Article] 非同期アレーにおける伝達関数ゲイン基底非負値行列因子分解を用いた遠方音源抑圧2017

    • Author(s)
      村瀬 慶和, 小野 順貴, 宮部 滋樹, 山田 武志, 牧野 昭二
    • Journal Title

      日本音響学会論文誌

      Volume: 印刷中 Pages: 印刷中

    • Peer Reviewed / Acknowledgement Compliant
  • [Journal Article] Listening-area-informed sound field reproduction with Gaussian prior based on circular harmonic expansion2017

    • Author(s)
      Natsuki Ueno, Shoichi Koyama and Hiroshi Saruwatari
    • Journal Title

      Proc. Joint Workshop on Hands-free Speech Communication and Microphone Arrays (HSCMA)

      Volume: - Pages: 196-200

    • DOI

      10.1109/HSCMA.2017.7895589

    • Peer Reviewed / Acknowledgement Compliant
  • [Journal Article] Listening-area-informed sound field reproduction based on circular harmonic expansion2017

    • Author(s)
      Natsuki Ueno, Shoichi Koyama and Hiroshi Saruwatari
    • Journal Title

      Proc.IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)

      Volume: - Pages: 111-115

    • DOI

      10.1109/ICASSP.2016.7471636

    • Peer Reviewed / Acknowledgement Compliant
  • [Journal Article] アドホックマイクロホンアレーにおける時間チャネル領域での非負値行列因子分解を用いた振幅ベースの音声強調2016

    • Author(s)
      千葉 大将, 小野 順貴, 宮部 滋樹, 高橋 祐, 山田 武志, 牧野 昭二
    • Journal Title

      日本音響学会論文誌

      Volume: 72 Pages: 462-470

    • Peer Reviewed
  • [Journal Article] Closed-form and Near closed-form Solutions for TOA-based Joint Source and Sensor Localization2016

    • Author(s)
      Trung-Kien Le and Nobutaka Ono
    • Journal Title

      IEEE Trans. Signal Processing

      Volume: 64 Pages: 4751-4766

    • DOI

      10.1109/TSP.2016.2569465

    • Peer Reviewed / Acknowledgement Compliant
  • [Journal Article] Self-Localization and Channel Synchronization of Smartphone Arrays Using Sound Emissions2016

    • Author(s)
      Nobutaka Ono, Kazuaki Shibata and Hirokazu Kameoka
    • Journal Title

      Proc. Asia-Pacific Signal and Information Processing Association (APSIPA) Annual Summit and Conference

      Volume: - Pages: -

    • DOI

      10.1109/APSIPA.2016.7820778

    • Peer Reviewed / Acknowledgement Compliant
  • [Journal Article] Robust TDOA-Based Joint Source And Microphone Localization in a Reverberant Environment Using Medians of Acceptable Recovered TOAs2016

    • Author(s)
      Trung-Kien Le and Nobutaka Ono
    • Journal Title

      Proc. IEEE International Workshop on Acoustic Signal Enhancement (IWAENC)

      Volume: - Pages: -

    • DOI

      10.1109/IWAENC.2016.7602942

    • Peer Reviewed / Acknowledgement Compliant
  • [Journal Article] A Computationally Cheaper Method for Blind Speech Separation Based on AuxIVA and Incomplete Demixing Transform2016

    • Author(s)
      Jakub Jansky, Zbynek Koldovsky and Nobutaka Ono
    • Journal Title

      Proc. IEEE International Workshop on Acoustic Signal Enhancement (IWAENC)

      Volume: - Pages: -

    • DOI

      10.1109/IWAENC.2016.7602921

    • Peer Reviewed / Int'l Joint Research / Acknowledgement Compliant
  • [Journal Article] Multi-talker Speech Recognition Based on Blind Source Separation with Ad hoc Microphone Array Using Smartphones and Cloud Storage2016

    • Author(s)
      Keiko Ochi, Nobutaka Ono, Shigeki Miyabe and Shoji Makino
    • Journal Title

      Proc. INTERSPEECH

      Volume: - Pages: 3369-3373

    • DOI

      10.21437/Interspeech.2016-758

    • Peer Reviewed / Acknowledgement Compliant
  • [Journal Article] Closed-form solution for TDOA-based joint source and sensor localization in two-dimensional space2016

    • Author(s)
      Trung-Kien Le and Nobutaka Ono
    • Journal Title

      Proc. European Signal Processing Conference (EUSIPCO)

      Volume: - Pages: 1373-1377

    • DOI

      10.1109/EUSIPCO.2016.7760473

    • Peer Reviewed / Open Access / Acknowledgement Compliant
  • [Journal Article] Frequency-domain Blind Speech Separation Using Incomplete De-mixing Transform2016

    • Author(s)
      Zbynek Koldovsky, Francesco Nesta, Petr Tichavsky and Nobutaka Ono
    • Journal Title

      Proc. European Signal Processing Conference (EUSIPCO)

      Volume: - Pages: 1663-1667

    • DOI

      10.1109/EUSIPCO.2016.7760531

    • Peer Reviewed / Open Access / Int'l Joint Research / Acknowledgement Compliant
  • [Journal Article] Online acoustic scene analysis based on nonparametric bayesian model2016

    • Author(s)
      Keisuke Imoto and Nobutaka Ono
    • Journal Title

      Proc. European Signal Processing Conference (EUSIPCO)

      Volume: - Pages: 988-992

    • DOI

      10.1109/EUSIPCO.2016.7760396

    • Peer Reviewed / Open Access / Acknowledgement Compliant
  • [Presentation] DNN-GMMと連結特徴量を用いた音響シーン識別の検討2017

    • Author(s)
      高橋 玄, 山田 武志, 小野 順貴, 牧野 昭二
    • Organizer
      日本音響学会2017年春季研究発表会
    • Place of Presentation
      川崎
    • Year and Date
      2017-03-15 – 2017-03-17
  • [Presentation] スパース時系列正則化付き独立低ランク行列分析における効率的な解法の検討2017

    • Author(s)
      三井 祥幹, 北村 大地, 高道 慎之介, 小野 順貴, 猿渡 洋
    • Organizer
      電子情報通信学会電気音響研究会
    • Place of Presentation
      京都
    • Year and Date
      2017-01-25 – 2017-01-26
  • [Presentation] 受聴エリア事前情報を用いた音場再現 ~ 任意のスピーカ配置と指向特性における検証 ~2017

    • Author(s)
      植野 夏樹, 小山 翔一, 猿渡 洋
    • Organizer
      電子情報通信学会電気音響研究会
    • Place of Presentation
      京都
    • Year and Date
      2017-01-25 – 2017-01-26
  • [Presentation] 伝達関数ゲイン基底NMFを用いた遠方雑音抑圧の実環境での評価2016

    • Author(s)
      松井 裕太郎, 山田 武志, 牧野 昭二, 小野 順貴
    • Organizer
      第31回信号処理シンポジウム
    • Place of Presentation
      大阪
    • Year and Date
      2016-11-08 – 2016-11-10
  • [Presentation] ヴァーチャル多素子化に基づく SN 比最大化ビームフォーマの残響に対する性能変化2016

    • Author(s)
      山岡 洸瑛, 小野 順貴, 山田 武志,牧野 昭二
    • Organizer
      日本音響学会2016年秋季研究発表会
    • Place of Presentation
      富山
    • Year and Date
      2016-09-14 – 2016-09-16
  • [Presentation] 自閉スペクトラム症者と定型発達者の音声特徴による識別の検討2016

    • Author(s)
      越智 景子, 小野 順貴, 大須賀 智子, 大和田 啓峰, 児島 正樹, 黒田 美保, 山末 英典, 嵯峨山 茂樹
    • Organizer
      日本音響学会2016年秋季研究発表会
    • Place of Presentation
      富山
    • Year and Date
      2016-09-14 – 2016-09-16
  • [Presentation] 受聴エリア事前情報を用いた音場再現 ~直線状アレイによる検証~2016

    • Author(s)
      植野 夏樹, 小山 翔一, 猿渡 洋
    • Organizer
      日本音響学会2016年秋季研究発表会
    • Place of Presentation
      富山
    • Year and Date
      2016-09-14 – 2016-09-16
  • [Presentation] アレイ信号処理の非同期分散チャンネルへの展開2016

    • Author(s)
      小野 順貴
    • Organizer
      電子情報通信学会音声研究会
    • Place of Presentation
      京都
    • Year and Date
      2016-08-24 – 2016-08-25
    • Invited
  • [Remarks] 複数話者の音声を同時認識する新しい音響信号処理技術を開発/音声認識による会話の文字起こしも可能に

    • URL

      http://www.nii.ac.jp/news/release/2016/0929.html

URL: 

Published: 2018-01-16  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi