分散音響センシングと非同期時系列モデリングに基づく音声・音響シーン認識の革新

研究課題

研究課題/領域番号	20H00613
研究種目	基盤研究(A)
配分区分	補助金
応募区分	一般
審査区分	中区分61:人間情報学およびその関連分野
研究機関	東京都立大学
研究代表者	小野順貴東京都立大学, システムデザイン研究科, 教授 (80334259)
研究分担者	須山章子 (荒木章子) 日本電信電話株式会社NTTコミュニケーション科学基礎研究所, メディア情報研究部, 主幹研究員 (30396212) 井本桂右同志社大学, 理工学部, 准教授 (90802116) 塩田さやか東京都立大学, システムデザイン研究科, 准教授 (90705039) 宮崎亮一徳山工業高等専門学校, 情報電子工学科, 准教授 (40734728) 貴家仁志東京都立大学, システムデザイン研究科, 教授 (40157110)
研究期間 (年度)	2020-04-01 – 2024-03-31
研究課題ステータス	完了 (2023年度)
配分額 *注記	45,240千円 (直接経費: 34,800千円、間接経費: 10,440千円) 2023年度: 9,620千円 (直接経費: 7,400千円、間接経費: 2,220千円) 2022年度: 10,530千円 (直接経費: 8,100千円、間接経費: 2,430千円) 2021年度: 10,530千円 (直接経費: 8,100千円、間接経費: 2,430千円) 2020年度: 14,560千円 (直接経費: 11,200千円、間接経費: 3,360千円)
キーワード	分散マイクロホンアレイ / 分散音響センシング / 音声認識 / 音響シーン認識 / 音源分離 / 同期 / 音光変換 / ブリンキー / 非同期
研究開始時の研究の概要	本研究の目的は、複数録音機器を広範囲に配置し、分散音響センシングと非同期時系列モデリングにより、音声認識、音響シーン認識の性能を格段に向上することである。具体的な応用には、１）会議議事録の作成、実環境会話分析などオフライン処理可能なもの、２）セキュリティ、異常検出などリアルタイム処理が必要なものの２つに大別されるが、技術的には両方に共通する課題も多い。よって本研究ではこれらを、A) 複数機器のブラインド同期と音声認識応用、B) 音光変換センサを併用したマルチモーダルセンシング、C) 音響シーン認識応用の３つの研究トラックに整理し、研究を進める。
研究成果の概要	本研究では、非同期信号をブラインドに同期する技術として、高精度時間差推定やサンプリング周波数ミスマッチ推定とその補償について、効率的なアルゴリズムを構築し、また、音響オブジェクトキャンセラーやサンプリング周波数変動下でのインパルス応答推定などに展開した。音光変換を用いたマルチモーダルな音響センシングとしては、従来の強度変換だけでなく、メロディの可視化、小規模ＤＮＮによる発話推定、圧縮センシングに基づくスパーススペクトルの復元の他、end-to-end学習による音響シーン認識のための最適化など、目的に応じた手法を構築した。分散センシングに基づく空間特徴量の音響シーン認識に対する有効性も確認した。
研究成果の学術的意義や社会的意義	マイクロホンを分散配置し音響信号処理を行うには、従来は厳密な時間同期が必要であり、有線接続は煩雑な配線を、無線の利用は大きな帯域幅を必要とするなどの困難があった。これに対し本研究は、我々の身の回りにあるスマートフォン、モバイル端末などの複数の録音機器を観測信号のみから同期する手法を確立した。これにより分散録音機器をアレイ信号処理、具体的には音源分離、音源強調，空間情報の取得などに活用することが可能となった。これらは遠隔音声認識や音響シーン認識の性能向上に大きく貢献する。また音光変換とビデオカメラを用いた音響分散センシングの独自の枠組みを進展させ、音響シーン認識の新しい方向性を提示できた。

報告書

(6件)

研究成果
(94件)

すべて 2024 2023 2022 2021 2020 その他

すべて国際共同研究 (1件) 雑誌論文 (42件) (うち国際共著 1件、査読あり 41件、オープンアクセス 12件) 学会発表 (51件) (うち招待講演 3件)

[国際共同研究] Carnegie Mellon University(米国)
- 関連する報告書
  2023 実績報告書
[雑誌論文] Efficient Joint Optimization of Sampling Rate Offsets Using Entire Multichannel Signal2024
- 著者名/発表者名
  Y. Masuyama, K. Yamaoka, T. Kawamura, and N. Ono
- 雑誌名
  
  IEEE/ACM Transactions on Audio, Speech, and Language Processing
  
  巻: 32 ページ: 1816-1828
- DOI
  10.1109/taslp.2024.3369532
- 関連する報告書
  2023 実績報告書 2022 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Causal and Relaxed-Distortionless Response Beamforming for Online Target Source Extraction2024
- 著者名/発表者名
  Y. Masuyama, K. Yamaoka, Y. Kinoshita, T. Nakashima, and N. Ono
- 雑誌名
  
  IEEE/ACM Transactions on Audio, Speech, and Language Processing
  
  巻: 32 ページ: 310-324
- DOI
  10.1109/taslp.2023.3329377
- 関連する報告書
  2023 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Refining Knowledge Transfer on Audio-Image Temporal Agreement for Audio-Text Cross Retrieval2024
- 著者名/発表者名
  Shunsuke Tsubaki, Daisuke Niizumi, Daiki Takeuchi, Yasunori Ohishi, Noboru Harada, and Keisuke Imoto
- 雑誌名
  
  Proc. EUSIPCO
  
  巻: - ページ: 1-5
- 関連する報告書
  2023 実績報告書
- 査読あり
[雑誌論文] Joint analysis of acoustic scenes and sound events based on multitask learning with dynamic weight adaptation2023
- 著者名/発表者名
  Kayo Nada, Keisuke Imoto, and Takao Tsuchiya
- 雑誌名
  
  Acoustical Science and Technology
  
  巻: 44 号: 3 ページ: 167-175
- DOI
  10.1250/ast.44.167
- ISSN
  0369-4232, 1346-3969, 1347-5177
- 年月日
  2023-05-01
- 関連する報告書
  2023 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Objective assessment of autism spectrum disorder based on performance in structured interpersonal acting‐out tasks with prosodic stability and variability2023
- 著者名/発表者名
  Ochi Keiko、Kojima Masaki、Ono Nobutaka、Kuroda Miho、Owada Keiho、Sagayama Shigeki、Yamasue Hidenori
- 雑誌名
  
  Autism Research
  
  巻: 17 号: 2 ページ: 395-409
- DOI
  10.1002/aur.3080
- 関連する報告書
  2023 実績報告書
- 査読あり
[雑誌論文] Minimum-Spanning-Tree-Based Time Delay Estimation Robust to Outliers2023
- 著者名/発表者名
  Yamaoka Kouei、Nakashima Taishi、Wakabayashi Yukoh、Ono Nobutaka
- 雑誌名
  
  IEEE Access
  
  巻: 11 ページ: 121284-121294
- DOI
  10.1109/access.2023.3327011
- 関連する報告書
  2023 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Acoustic Object Canceller: Removing Known Signal Using Blind Syncronization2023
- 著者名/発表者名
  Takao Kawamura, Kouei Yamaoka, Yukoh Wakabayashi, Nobutaka Ono, and Ryoichi Miyazaki
- 雑誌名
  
  EURASIP Journal on Audio, Speech, and Music Processing
  
  巻: - 号: 1 ページ: 1-16
- DOI
  10.1186/s13636-023-00300-y
- 関連する報告書
  2023 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Sound Field Interpolation for Rotation-Invariant Multichannel Array Signal Processing2023
- 著者名/発表者名
  Wakabayashi Yukoh、Yamaoka Kouei、Ono Nobutaka
- 雑誌名
  
  IEEE/ACM Transactions on Audio, Speech, and Language Processing
  
  巻: 31 ページ: 2286-2298
- DOI
  10.1109/taslp.2023.3282098
- 関連する報告書
  2023 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Missing data completion of multi-channel signals using autoencoder for acoustic scene classification2023
- 著者名/発表者名
  Yuki Shiroma, Yuma Kinoshita, Keisuke Imoto, Sayaka Shiota, Nobutaka Ono, and Hitoshi Kiya
- 雑誌名
  
  APSIPA Transactions on Signal and Information Processing
  
  巻: 12 号: 3 ページ: 1-22
- DOI
  10.1561/116.00000074
- 関連する報告書
  2023 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Augmentation of Various Speed Data by Controlling Frame Overlap for Acoustic Traffic Monitoring2023
- 著者名/発表者名
  Tomohiro Takahashi, Yuma Kinoshita, Natsuki Ueno, Yukoh Wakabayashi, Nobutaka Ono, Jun Honda, Seishi Fukuma, Aoi Kitamori, Hiroshi Nakagawa
- 雑誌名
  
  Proc. APSIPA ASC
  
  巻: - ページ: 2068-2072
- DOI
  10.1109/apsipaasc58517.2023.10317558
- 関連する報告書
  2023 実績報告書
- 査読あり
[雑誌論文] Automatic Call Classification of Autism Model Marmosets by Deep Learning and Analysis of Their Vocal Development2023
- 著者名/発表者名
  Minato Uesaka, Hideto Kawauchi, Kouei Yamaoka, Yukoh Wakabayashi, Yuma Kinoshita, Nobutaka Ono, Jun Noguchi, Satoshi Watanabe, Noritaka Ichinohe, Seico Benner, Hidenori Yamasue
- 雑誌名
  
  Proc. APSIPA ASC
  
  巻: - ページ: 2214-2218
- DOI
  10.1109/apsipaasc58517.2023.10317121
- 関連する報告書
  2023 実績報告書
- 査読あり
[雑誌論文] Exploring the integration of speech separation and recognition with self-supervised learning representation2023
- 著者名/発表者名
  Yoshiki Masuyama, Xuankai Chnag, Wangyou Zhang, Samuele Cornell, Zhong-Qiu Wang, Nobutaka Ono, Yanmin Qian, Shinji Watanabe
- 雑誌名
  
  Proc. WASPAA
  
  巻: - ページ: 1-5
- DOI
  10.1109/waspaa58266.2023.10248096
- 関連する報告書
  2023 実績報告書
- 査読あり / 国際共著
[雑誌論文] Signal Reconstruction from Mel-spectrogram Based on Bi-level Consistency of Full-band Magnitude and Phase2023
- 著者名/発表者名
  Yoshiki Masuyama, Natsuki Ueno, Nobutaka Ono
- 雑誌名
  
  Proc. WASPAA
  
  巻: - ページ: 1-5
- DOI
  10.1109/waspaa58266.2023.10248111
- 関連する報告書
  2023 実績報告書
- 査読あり
[雑誌論文] Acoustic Traffic Monitoring Based on Deep Neural Network Trained by Stereo-Recorded Sound and Sensor Data2023
- 著者名/発表者名
  Tomohiro Takahashi, Yuma Kinoshita, Yukoh Wakabayashi, and Nobutaka Ono, Jun Honda, Seishi Fukuma, Aoi Kitamori and Hiroshi Nakagawa
- 雑誌名
  
  Proc. EUSIPCO
  
  巻: - ページ: 1-5
- DOI
  10.23919/eusipco58844.2023.10290031
- 関連する報告書
  2023 実績報告書
- 査読あり
[雑誌論文] Unaliasing of Recorded Signals Based on Blind Source Separation2023
- 著者名/発表者名
  Yuki Nakamura, Nobutaka Ono, Taishi Nakashima, Ryoichi Miyazaki
- 雑誌名
  
  Proc. EUSIPCO
  
  巻: - ページ: 1-5
- DOI
  10.23919/eusipco58844.2023.10290097
- 関連する報告書
  2023 実績報告書
- 査読あり
[雑誌論文] Fast Online Source Steering Algorithm for Tracking Single Moving Source Using Online Independent Vector Analysis2023
- 著者名/発表者名
  Taishi Nakashima, Rintaro Ikeshita, Nobutaka Ono, Shoko Araki, and Tomohiro Nakatani
- 雑誌名
  
  Proc. ICASSP
  
  巻: - ページ: 1-5
- DOI
  10.1109/icassp49357.2023.10094962
- 関連する報告書
  2023 実績報告書
- 査読あり
[雑誌論文] Joint Analysis of Acoustic Scenes and Sound Events Based on Semi-Supervised Approach2023
- 著者名/発表者名
  Ami Igarashi, Shunsuke Tsubaki, Daisuke Niizumi, Daiki Takeuchi, Noboru Harada, and Keisuke Imoto
- 雑誌名
  
  Proc. APSIPA ASC
  
  巻: - ページ: 2050-2056
- DOI
  10.1109/apsipaasc58517.2023.10317353
- 関連する報告書
  2023 実績報告書
- 査読あり
[雑誌論文] 環境音分析・異常音検知の研究動向2022
- 著者名/発表者名
  井本桂右, 川口洋平
- 雑誌名
  
  電子情報通信学会基礎・境界ソサイエティ Fundamentals Review
  
  巻: 15 号: 4 ページ: 268-280
- DOI
  10.1587/essfr.15.4_268
- ISSN
  1882-0875
- 年月日
  2022-04-01
- 関連する報告書
  2022 実績報告書
- オープンアクセス
[雑誌論文] Compressed Sensing of Sparse Spectrum Using Distributed Sound-to-Light Conversion Device Blinkies2022
- 著者名/発表者名
  Satoshi Motoyama, Natsuki Ueno, Yuma Kinoshita, Nobutaka Ono
- 雑誌名
  
  Proc. APSIPA ASC
  
  巻: - ページ: 12-16
- DOI
  10.23919/apsipaasc55919.2022.9979874
- 関連する報告書
  2022 実績報告書
- 査読あり
[雑誌論文] Estimation of Transfer Coefficients and Signals of Sound-to-Light Conversion Device Blinky Under Saturation2022
- 著者名/発表者名
  Kosuke Nishida, Natsuki Ueno, Yuma Kinoshita, Nobutaka Ono
- 雑誌名
  
  Proc. APSIPA ASC
  
  巻: - ページ: 718-723
- DOI
  10.23919/apsipaasc55919.2022.9980090
- 関連する報告書
  2022 実績報告書
- 査読あり
[雑誌論文] How Information on Acoustic Scenes and Sound Events Mutually Benefits Event Detection and Scene Classification Tasks2022
- 著者名/発表者名
  Ami Igarashi, Keisuke Imoto, Yuka Komatsu, Shunsuke Tsubaki, Shuto Hario, and Tatsuya Komatsu
- 雑誌名
  
  Proc. APSIPA ASC
  
  巻: - ページ: 7-11
- DOI
  10.23919/apsipaasc55919.2022.9979926
- 関連する報告書
  2022 実績報告書
- 査読あり
[雑誌論文] Analysis and source separation of overlapping speech using corpus of everyday japanese conversation2022
- 著者名/発表者名
  Haruki Nammoku, Kouei Yamaoka, Taishi Nakashima, Yukoh Wakabayashi, Nobutaka Ono
- 雑誌名
  
  Proc. ICA
  
  巻: -
- 関連する報告書
  2022 実績報告書
- 査読あり
[雑誌論文] Joint Optimization of Sampling Rate Offsets Based on Entire Signal Relationship Among Distributed Microphones2022
- 著者名/発表者名
  Yoshiki Masuyama, Kouei Yamaoka, Nobutaka Ono
- 雑誌名
  
  Proc. INTERSPEECH
  
  巻: - ページ: 704-708
- DOI
  10.21437/interspeech.2022-97
- 関連する報告書
  2022 実績報告書
- 査読あり
[雑誌論文] Use of Nods Less Synchronized with Turn-Taking and Prosody During Conversations in Adults with Autism2022
- 著者名/発表者名
  Ochi Keiko, Ono Nobutaka, Owada Keiho, Miho Kuroda, Sagayama Shigeki, Yamasue Hidenori
- 雑誌名
  
  INTERSPEECH 2022
  
  巻: - ページ: 1136-1140
- DOI
  10.21437/interspeech.2022-11388
- 関連する報告書
  2022 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Joint Analysis of Acoustic Scenes and Sound Events with Weakly labeled Data2022
- 著者名/発表者名
  Shunsuke Tsubaki, Keisuke Imoto, Nobutak Ono
- 雑誌名
  
  Proc. IWAENC
  
  巻: - ページ: 1-5
- DOI
  10.1109/iwaenc53105.2022.9914800
- 関連する報告書
  2022 実績報告書
- 査読あり
[雑誌論文] Missing data recovery using autoencoder for multi-channel acoustic scene classification2022
- 著者名/発表者名
  Yuki Shiroma, Yuma Kinoshita, Keisuke Imoto, Sayaka Shiota, Nobutaka Ono, Hitoshi Kiya
- 雑誌名
  
  Proc. EUSIPCO
  
  巻: - ページ: 767-771
- DOI
  10.23919/eusipco55093.2022.9909955
- 関連する報告書
  2022 実績報告書
- 査読あり
[雑誌論文] Entrainment Analysis for Assessment of Autistic Speech Prosody Using Bottleneck Features of Deep Neural Network2022
- 著者名/発表者名
  Ochi Keiko, Ono Nobutaka, Owada Keiho, Kuroda Miho, Sagayama Shigeki, Yamasue Hidenori
- 雑誌名
  
  ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings
  
  巻: - ページ: 8492-8496
- DOI
  10.1109/icassp43922.2022.9746787
- 関連する報告書
  2022 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Real-Time Pitch Visualization with “Blinky" Sound-to-Light Conversion Device2021
- 著者名/発表者名
  Kanato Ishii, Yuma Kinoshita, Yukoh Wakabayashi, and Nobutaka Ono
- 雑誌名
  
  信号処理
  
  巻: 25 号: 6 ページ: 213-220
- DOI
  10.2299/jsp.25.213
- NAID
  130008110101
- ISSN
  1342-6230, 1880-1013
- 年月日
  2021-11-01
- 関連する報告書
  2021 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Time-Frequency-Bin-Wise Linear Combination of Beamformers for Distortionless Signal Enhancement2021
- 著者名/発表者名
  Kouei Yamaoka, Nobutaka Ono, and Shoji Makino
- 雑誌名
  
  IEEE/ACM Transactions on Audio, Speech, and Language Processing
  
  巻: 29 ページ: 3461-3475
- DOI
  10.1109/taslp.2021.3126950
- 関連する報告書
  2021 実績報告書
- 査読あり / オープンアクセス
[雑誌論文] Sharpening Directivity of Beamforming Based on Neural Networks Using Virtual Observations2021
- 著者名/発表者名
  Yuki Kanekiyo, Mitsuhiro Mizumachi,?Ryoichi Miyazaki
- 雑誌名
  
  Proc. GCCE
  
  巻: - ページ: 512-513
- DOI
  10.1109/gcce53005.2021.9621789
- 関連する報告書
  2021 実績報告書
- 査読あり
[雑誌論文] Phase representation based on HSV color model for acoustic classification with convolutional neural networks2021
- 著者名/発表者名
  Yuki Shiroma, Yuma Kinoshita, Sayaka Shiota, and Hitoshi Kiya,
- 雑誌名
  
  Proc. GCCE
  
  巻: - ページ: 427-429
- DOI
  10.1109/gcce53005.2021.9621891
- 関連する報告書
  2021 実績報告書
- 査読あり
[雑誌論文] Analysis on Roles of DNNs in End-to-End Acoustic Scene Analysis Framework with Distributed Sound-to-Light Conversion Devices2021
- 著者名/発表者名
  Yuma Kinoshita and Nobutaka Ono
- 雑誌名
  
  Proc. APSIPA
  
  巻: - ページ: 1167-1172
- 関連する報告書
  2021 実績報告書
- 査読あり
[雑誌論文] Causal Distortionless Response Beamforming by Alternating Direction Method of Multipliers2021
- 著者名/発表者名
  Yoshiki Masuyama, Kouei Yamaoka, Yuma Kinoshita, and Nobutaka Ono
- 雑誌名
  
  Proc. APSIPA
  
  巻: - ページ: 585-590
- 関連する報告書
  2021 実績報告書
- 査読あり
[雑誌論文] Investigation on Spatial and Frequency-based Features for Asynchronous Acoustic Scene Analysis2021
- 著者名/発表者名
  Yuki Shiroma, Keisuke Imoto, Sayaka Shiota, Nobutaka Ono, and Hitoshi Kiya
- 雑誌名
  
  Proc. APSIPA
  
  巻: - ページ: 1161-1166
- 関連する報告書
  2021 実績報告書
- 査読あり
[雑誌論文] Pitch and Volume Stability in the Communicative Response of the Adults with Autism2021
- 著者名/発表者名
  Keiko Ochi, Masaki Kojima, Keiho Owada, Nobutaka Ono, Shigeki Sagayama, and Hidenori Yamasue
- 雑誌名
  
  Proc. APSIPA
  
  巻: - ページ: 428-432
- 関連する報告書
  2021 実績報告書
- 査読あり
[雑誌論文] End-to-End Training for Acoustic Scene Analysis with Distributed Sound-to-Light Conversion Devices2021
- 著者名/発表者名
  Yuma Kinoshita and Nobutaka Ono
- 雑誌名
  
  Proc. EUSIPCO
  
  巻: - ページ: 1010-1014
- DOI
  10.23919/eusipco54536.2021.9616341
- 関連する報告書
  2021 実績報告書
- 査読あり
[雑誌論文] Rotation-robust beamforming based on sound field interpolation with regularly circular microphone array2021
- 著者名/発表者名
  Yukoh Wakabayashi, Kouei Yamaoka, and Nobutaka Ono
- 雑誌名
  
  Proc. ICASSP
  
  巻: - ページ: 771-775
- DOI
  10.1109/icassp39728.2021.9414196
- 関連する報告書
  2021 実績報告書
- 査読あり
[雑誌論文] Voice Activity Detection for Speech Dialog Recorded by Two Distributed Microphones Towards Diagnosis of Autism Spectrum Disorder2021
- 著者名/発表者名
  Hideto Kawauchi, Yukoh Wakabayashi, Nobutaka Ono, Keiko Ochi, Keiho Owada, Masaki Kojima, Shigeki Sagayama, and Hidenori Yamasue
- 雑誌名
  
  Proc. NCSP
  
  巻: - ページ: 361-364
- 関連する報告書
  2020 実績報告書
- 査読あり
[雑誌論文] Real-Time Pitch Visualization Using Sound-Light Conversion Device "Blinky"2021
- 著者名/発表者名
  Kanato Ishii, Yuma Kinoshita, Yukoh Wakabayashi, and Nobutaka Ono
- 雑誌名
  
  Proc. NCSP
  
  巻: - ページ: 101-104
- 関連する報告書
  2020 実績報告書
- 査読あり
[雑誌論文] Dynamic synchronous averaging for enhancement of periodic signal under sampling frequency variation2020
- 著者名/発表者名
  Kyosuke Sumiyoshi, Yukoh Wakabayashi, and Nobutaka Ono
- 雑誌名
  
  Proc. APSIPA
  
  巻: - ページ: 863-868
- 関連する報告書
  2020 実績報告書
- 査読あり
[雑誌論文] Experimental investigation of robustness of spatial cepstrum features under various conditions2020
- 著者名/発表者名
  Taiga Kawamura, Ryoichi Miyazaki, Keisuke Imoto, and Nobutaka Ono
- 雑誌名
  
  Proc. APSIPA
  
  巻: - ページ: 701-704
- 関連する報告書
  2020 実績報告書
- 査読あり
[雑誌論文] Energy-Based Multiple Source Localization with Blinkies2020
- 著者名/発表者名
  Daiki Horiike, Robin Scheibler, Yuma Kinoshita, Yukoh Wakabayashi, and Nobutaka Ono
- 雑誌名
  
  Proc. APSIPA
  
  巻: - ページ: 443-448
- 関連する報告書
  2020 実績報告書
- 査読あり
[学会発表] 非負値行列因子分解を用いた音光変換デバイス「ブリンキー」の光信号飽和時における伝達係数と信号の同時推定2024
- 著者名/発表者名
  西田光佑，植野夏樹，小野順貴，北村大地
- 学会等名
  SPEASIPワークショップ
- 関連する報告書
  2023 実績報告書
[学会発表] 日常会話の発話重畳分析と非同期分散録音に対するオンライン独立ベクトル分析による分離の検討2024
- 著者名/発表者名
  南木春希，中嶋大志，山岡洸瑛，若林佑幸，小野順貴
- 学会等名
  SPEASIPワークショップ
- 関連する報告書
  2023 実績報告書
[学会発表] これから始める環境音分析・合成2024
- 著者名/発表者名
  井本桂右
- 学会等名
  SPEASIPワークショップ
- 関連する報告書
  2023 実績報告書
- 招待講演
[学会発表] アノテータごとのばらつきを考慮した音響イベント検出2024
- 著者名/発表者名
  古賀直樹, 坂東宣昭, 井本桂右
- 学会等名
  情報処理学会第86回全国大会
- 関連する報告書
  2023 実績報告書
[学会発表] スマートフォン上での音光変換を用いた音響情報のデジタル伝送2024
- 著者名/発表者名
  今村瑛月, 河村隆生, 山田健太, 植野夏樹, 小野順貴
- 学会等名
  日本音響学会2024年春季研究発表会
- 関連する報告書
  2023 実績報告書
[学会発表] 相互相関と動的計画法を用いた欠損のある信号のブラインド同期2024
- 著者名/発表者名
  竹内駿人, 河村隆生, 植野夏樹, 小野順貴
- 学会等名
  日本音響学会2024年春季研究発表会
- 関連する報告書
  2023 実績報告書
[学会発表] 残響環境下におけるエイリアス成分の分離に有効なパーミュテーション解法の検討2024
- 著者名/発表者名
  中村優希, 宮崎亮一, 小野順貴
- 学会等名
  日本音響学会2024年春季研究発表会
- 関連する報告書
  2023 実績報告書
[学会発表] 環境音分析における事前学習済みモデルのバイアス調査2024
- 著者名/発表者名
  井上かほり, 井本桂右
- 学会等名
  日本音響学会2024年春季研究発表会
- 関連する報告書
  2023 実績報告書
[学会発表] フレームシフトの調整による低速度域車両走行音のデータ拡張2023
- 著者名/発表者名
  高橋知宏, 木下裕磨, 植野夏樹, 若林佑幸, 小野順貴, 本多潤, 福馬誠士, 北森葵, 中川浩
- 学会等名
  日本音響学会2023年秋季研究発表会
- 関連する報告書
  2023 実績報告書
[学会発表] 距離に基づく音源分離を用いたシングルチャンネル環境音分類2023
- 著者名/発表者名
  小倉稜也, 井本桂右, 貴家仁志, 塩田さやか
- 学会等名
  日本音響学会2023年秋季研究発表会
- 関連する報告書
  2023 実績報告書
[学会発表] Voice-to-foley: 環境音を模倣した音声を入力とする環境音合成2023
- 著者名/発表者名
  岡本悠希, 井本桂右, 高道慎之介, 永瀬亮太郎, 福森隆寛, 山下洋一
- 学会等名
  日本音響学会2023年秋季研究発表会
- 関連する報告書
  2023 実績報告書
[学会発表] 多チャネル時間差推定における性能限界の導出2023
- 著者名/発表者名
  山岡洸瑛, 植野夏樹, 小野順貴
- 学会等名
  日本音響学会2023年春季研究発表会
- 関連する報告書
  2022 実績報告書
[学会発表] 独立ベクトル分析によるオンライン音源分離・追跡のための高速最適化2023
- 著者名/発表者名
  中嶋大志, 池下林太郎, 小野順貴, 荒木章子, 中谷智広
- 学会等名
  日本音響学会2023年春季研究発表会
- 関連する報告書
  2022 実績報告書
[学会発表] エイリアシング成分のブラインド信号分離とそれに基づく帯域復元2023
- 著者名/発表者名
  中村優希, 中嶋大志, 小野順貴, 宮崎亮一
- 学会等名
  日本音響学会2023年春季研究発表会
- 関連する報告書
  2022 実績報告書
- 招待講演
[学会発表] 機械学習によるマーモセットの発声分類とそれに基づく発達に伴う発声変化の分析2023
- 著者名/発表者名
  上坂奏人，河内秀人，山岡洸瑛，若林佑幸，木下裕磨，小野順貴，渡邉惠，野口潤，一戸紀孝，ベナー聖子，山末英典
- 学会等名
  日本音響学会2023年春季研究発表会
- 関連する報告書
  2022 実績報告書
[学会発表] トラフィックカウンタにより取得した学習データに基づく音による交通モニタリング2023
- 著者名/発表者名
  高橋知宏，木下裕磨，若林佑幸，小野順貴，本多潤，福馬誠士，中川浩
- 学会等名
  日本音響学会2023年春季研究発表会
- 関連する報告書
  2022 実績報告書
[学会発表] 計算機による環境音の理解・解釈に向けた統合的コンペティションDCASE Challengeへの招待2023
- 著者名/発表者名
  井本桂右
- 学会等名
  日本音響学会2023年春季研究発表会
- 関連する報告書
  2022 実績報告書
[学会発表] 半教師あり学習に基づく音響シーンと音響イベントの同時分析2023
- 著者名/発表者名
  五十嵐彩美, 椿俊介, 井本桂右
- 学会等名
  電子情報通信学会音声研究会
- 関連する報告書
  2022 実績報告書
[学会発表] 音光変換デバイス「ブリンキー」を用いた圧縮センシングに基づくスパースなスペクトルの推定2022
- 著者名/発表者名
  本山智司，植野夏樹，木下裕磨，小野順貴
- 学会等名
  信号処理シンポジウム
- 関連する報告書
  2022 実績報告書
[学会発表] 補助関数法に基づく円状マイクロホンアレイの自己回転角度推定2022
- 著者名/発表者名
  連冠三, 山岡洸瑛, 若林佑幸, 小野順貴
- 学会等名
  日本音響学会2022年秋季研究発表会
- 関連する報告書
  2022 実績報告書
[学会発表] 最小全域木を用いた複数時間差の同時推定2022
- 著者名/発表者名
  山岡洸瑛, 中嶋大志, 小野順貴
- 学会等名
  日本音響学会2022年秋季研究発表会
- 関連する報告書
  2022 実績報告書
[学会発表] 因果的MPDRビームフォーマのオンライン化およびタップ長の影響評価2022
- 著者名/発表者名
  升山義紀, 山岡洸瑛, 木下裕磨, 小野順貴
- 学会等名
  日本音響学会2022年秋季研究発表会
- 関連する報告書
  2022 実績報告書
[学会発表] 音響シーン認識のためのサブアレイ間相関特徴量の検討2022
- 著者名/発表者名
  河村隆生, 木下裕磨, 小野順貴, シャイブラーロビン
- 学会等名
  日本音響学会2022年秋季研究発表会
- 関連する報告書
  2022 実績報告書
[学会発表] ブラインド音源分離における分離行列の一般化ランク1更新2022
- 著者名/発表者名
  小野順貴
- 学会等名
  電子情報通信学会応用音響研究会
- 関連する報告書
  2022 実績報告書
[学会発表] 『日本語日常会話コーパス』における発話の重なり分析とそれに対する音源分離の検討2022
- 著者名/発表者名
  南木春希, 山岡洸瑛, 若林佑幸, 小野順貴
- 学会等名
  シンポジウム「日常会話コーパス」Ⅶ
- 関連する報告書
  2021 実績報告書
[学会発表] 自己符号化器を用いた多チャンネル信号の欠損復元法と環境音分類における評価2022
- 著者名/発表者名
  城間佑樹, 木下裕磨, 井本桂右, 塩田さやか, 小野順貴, 貴家仁志
- 学会等名
  電気音響／応用音響研究会
- 関連する報告書
  2021 実績報告書
[学会発表] 弱ラベルを用いた音響シーンとイベントの同時分析2022
- 著者名/発表者名
  椿竣介，宇都瑛祐，井本桂右，小野順貴
- 学会等名
  日本音響学会春季研究発表会
- 関連する報告書
  2021 実績報告書
[学会発表] 音光変換デバイス「ブリンキー」を用いた振幅スペクトルの圧縮センシング2022
- 著者名/発表者名
  本山智司, 石井奏人, 植野夏樹, 木下裕磨, 小野順貴
- 学会等名
  日本音響学会春季研究発表会
- 関連する報告書
  2021 実績報告書
[学会発表] 補助関数法を用いた複数時間差のオンライン推定2022
- 著者名/発表者名
  山岡洸瑛, 中嶋大志, 若林佑幸, 小野順貴
- 学会等名
  日本音響学会春季研究発表会
- 関連する報告書
  2021 実績報告書
[学会発表] 補助関数法による複数の非同期録音信号のブラインド同期2022
- 著者名/発表者名
  升山義紀, 山岡洸瑛, 小野順貴
- 学会等名
  日本音響学会春季研究発表会
- 関連する報告書
  2021 実績報告書
[学会発表] 音光変換デバイス「ブリンキー」の光信号飽和時における伝達係数と信号の推定2022
- 著者名/発表者名
  西田光佑, 石井奏人, 植野夏樹, 木下裕磨, 小野順貴
- 学会等名
  日本音響学会春季研究発表会
- 関連する報告書
  2021 実績報告書
[学会発表] 非同期分散マイクロフォンを活用する音響信号処理2021
- 著者名/発表者名
  小野順貴
- 学会等名
  言語資源活用ワークショップ
- 関連する報告書
  2021 実績報告書
- 招待講演
[学会発表] 円状マイクロホンアレイを利用した音場補間によるステアリングベクトル補間への応用2021
- 著者名/発表者名
  若林佑幸, 山岡洸瑛, 小野順貴
- 学会等名
  日本音響学会秋季研究発表会
- 関連する報告書
  2021 実績報告書
[学会発表] 時間周波数線形結合ビームフォーマの空間フィルタ数に対する音源強調性能の評価2021
- 著者名/発表者名
  山岡洸瑛, 小野順貴
- 学会等名
  日本音響学会秋季研究発表会
- 関連する報告書
  2021 実績報告書
[学会発表] 因果的MPDRビームフォーマの近接分離最適化による設計2021
- 著者名/発表者名
  升山義紀, 山岡洸瑛, 木下裕磨, 小野順貴
- 学会等名
  日本音響学会秋季研究発表会
- 関連する報告書
  2021 実績報告書
[学会発表] 微弱周期信号と動的同期加算を用いたサンプリング周波数変動下でのインパルス応答推定2021
- 著者名/発表者名
  住吉亨介, 山岡洸瑛, 若林佑幸, 小野順貴
- 学会等名
  日本音響学会秋季研究発表会
- 関連する報告書
  2021 実績報告書
[学会発表] 深層学習に基づく楽器音分類のための画像分類ネットワークを用いたファインチューニング2021
- 著者名/発表者名
  城間佑樹, 木下裕磨, 塩田さやか, 貴家仁志
- 学会等名
  音学シンポジウム
- 関連する報告書
  2021 実績報告書
[学会発表] 非同期会話録音に対する時間周波数マスキングと独立ベクトル分析を用いた音源分離の検討2021
- 著者名/発表者名
  南木春希, 山岡洸瑛, 若林佑幸, 小野順貴
- 学会等名
  音学シンポジウム
- 関連する報告書
  2021 実績報告書
[学会発表] 直交検波を用いた音光変換デバイス「ブリンキー」のLEDの位置推定2021
- 著者名/発表者名
  佐藤直哉, 若林佑幸, 木下裕磨, 小野順貴
- 学会等名
  日本音響学会春季研究発表会
- 関連する報告書
  2020 実績報告書
[学会発表] 音光変換デバイス「ブリンキー」を用いた音響信号処理のための信号伝搬シミュレータ2021
- 著者名/発表者名
  岩本基裕, 木下裕磨, 若林佑幸, 小野順貴
- 学会等名
  日本音響学会春季研究発表会
- 関連する報告書
  2020 実績報告書
[学会発表] 音場補間に基づく円状マイクロフォンアレイの自己回転角度推定2021
- 著者名/発表者名
  連冠三, 中嶋大志, 若林佑幸, 小野順貴
- 学会等名
  日本音響学会春季研究発表会
- 関連する報告書
  2020 実績報告書
[学会発表] 音場補間を用いた円状マイクロホンアレイの回転に頑健なビームフォーミング2021
- 著者名/発表者名
  若林佑幸, 小野順貴
- 学会等名
  日本音響学会春季研究発表会
- 関連する報告書
  2020 実績報告書
[学会発表] 音光変換デバイス「ブリンキー」の信号伝搬過程を考慮したEnd-to-End音響シーン分析2021
- 著者名/発表者名
  木下裕磨, 小野順貴
- 学会等名
  日本音響学会春季研究発表会
- 関連する報告書
  2020 実績報告書
[学会発表] 補助関数法に基づく複数のチャネル間時間差の同時推定2021
- 著者名/発表者名
  山岡洸瑛, 小野順貴
- 学会等名
  日本音響学会春季研究発表会
- 関連する報告書
  2020 実績報告書
[学会発表] 分散マイクロホンアレイにおけるDOAパーミュテーションの反復更新による複数音源定位2021
- 著者名/発表者名
  田中一希, 若林佑幸, 小野順貴, 宮崎亮一
- 学会等名
  日本音響学会春季研究発表会
- 関連する報告書
  2020 実績報告書
[学会発表] ヴァーチャル観測信号を用いたニューラルネットワークビームフォーマの指向特性先鋭化2021
- 著者名/発表者名
  金清祐紀，水町光徳，宮崎亮一
- 学会等名
  日本音響学会春季研究発表会
- 関連する報告書
  2020 実績報告書
[学会発表] 実環境におけるマイクロホンの移動に対する空間ケプストラムの頑健性の調査2020
- 著者名/発表者名
  河村泰雅, 宮崎亮一, 井本桂右
- 学会等名
  日本音響学会秋季研究発表会
- 関連する報告書
  2020 実績報告書
[学会発表] 深層自己符号化器に基づく音響特徴量の離散符号化2020
- 著者名/発表者名
  木下裕磨, 小野順貴
- 学会等名
  日本音響学会秋季研究発表会
- 関連する報告書
  2020 実績報告書
[学会発表] 回転移動に頑健なアレイ信号処理のための音場の補間に関する一検討2020
- 著者名/発表者名
  若林佑幸, 小野順貴
- 学会等名
  日本音響学会秋季研究発表会
- 関連する報告書
  2020 実績報告書
[学会発表] 連続値マスクを用いた複数MVDRビームフォーマの組み合わせによる劣決定音声強調2020
- 著者名/発表者名
  山岡洸瑛, 小野順貴
- 学会等名
  日本音響学会秋季研究発表会
- 関連する報告書
  2020 実績報告書
[学会発表] ステレオ分散録音された対話音声に対するDNNを用いた発話区間検出2020
- 著者名/発表者名
  河内秀人, 若林佑幸, 小野順貴, 越智景子, 大和田啓峰, 児島正樹, 嵯峨山茂樹, 山末英典
- 学会等名
  音学シンポジウム
- 関連する報告書
  2020 実績報告書

分散音響センシングと非同期時系列モデリングに基づく音声・音響シーン認識の革新

研究代表者

小野 順貴 東京都立大学, システムデザイン研究科, 教授 (80334259)

45,240千円 (直接経費: 34,800千円、間接経費: 10,440千円)

報告書

研究成果

[国際共同研究] Carnegie Mellon University(米国)

関連する報告書

[雑誌論文] Efficient Joint Optimization of Sampling Rate Offsets Using Entire Multichannel Signal2024

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Causal and Relaxed-Distortionless Response Beamforming for Online Target Source Extraction2024

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Refining Knowledge Transfer on Audio-Image Temporal Agreement for Audio-Text Cross Retrieval2024

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Joint analysis of acoustic scenes and sound events based on multitask learning with dynamic weight adaptation2023

著者名/発表者名

雑誌名

DOI

ISSN

年月日

関連する報告書

[雑誌論文] Objective assessment of autism spectrum disorder based on performance in structured interpersonal acting‐out tasks with prosodic stability and variability2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Minimum-Spanning-Tree-Based Time Delay Estimation Robust to Outliers2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Acoustic Object Canceller: Removing Known Signal Using Blind Syncronization2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Sound Field Interpolation for Rotation-Invariant Multichannel Array Signal Processing2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Missing data completion of multi-channel signals using autoencoder for acoustic scene classification2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Augmentation of Various Speed Data by Controlling Frame Overlap for Acoustic Traffic Monitoring2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Automatic Call Classification of Autism Model Marmosets by Deep Learning and Analysis of Their Vocal Development2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Exploring the integration of speech separation and recognition with self-supervised learning representation2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Signal Reconstruction from Mel-spectrogram Based on Bi-level Consistency of Full-band Magnitude and Phase2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Acoustic Traffic Monitoring Based on Deep Neural Network Trained by Stereo-Recorded Sound and Sensor Data2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Unaliasing of Recorded Signals Based on Blind Source Separation2023

小野順貴東京都立大学, システムデザイン研究科, 教授 (80334259)

[雑誌論文] Real-Time Pitch Visualization with “Blinky" Sound-to-Light Conversion Device2021