研究課題/領域番号 |
20H00613
|
研究機関 | 東京都立大学 |
研究代表者 |
小野 順貴 東京都立大学, システムデザイン研究科, 教授 (80334259)
|
研究分担者 |
須山 章子 (荒木章子) 日本電信電話株式会社NTTコミュニケーション科学基礎研究所, メディア情報研究部, 主幹研究員 (30396212)
井本 桂右 同志社大学, 理工学部, 准教授 (90802116)
塩田 さやか 東京都立大学, システムデザイン研究科, 准教授 (90705039)
宮崎 亮一 徳山工業高等専門学校, 情報電子工学科, 准教授 (40734728)
|
研究期間 (年度) |
2020-04-01 – 2024-03-31
|
キーワード | 非同期 / 分散音響センシング / 音源分離 / 音声認識 / 音響シーン認識 |
研究実績の概要 |
本研究では研究トラックを、A)複数機器のブラインド同期と音声認識応用、B) 音光変換センサを併用したマルチモーダルセンシング、C) 音響シーン認識応用の3つの研究トラックに整理し、研究を進めてきた。主要な成果を以下にまとめる。 A)では、我々が「音響オブジェクト」と呼ぶ、事前に信号波形が入手可能な信号(例えば、商用音楽信号、携帯の着信音、各種報知音など)を、ブラインド同期に基づきモノラル録音から分離する手法を確立した。また、3台以上の録音機器に対し、特定の参照機器とその他の機器ののみのペアを考えるのではなく、全ての機器ペア間の同期を同時最適化として解く効率的なアルゴリズムを導出し、有効性を確認した。さらに、動的計画法により欠損ありの信号に対してブラインド同期を行う新たな手法を導出した。また、高精度音声認識を目指し、自己教師あり学習に基づく音声分離と認識の統合を、米国CMUと共同研究として行った。 B)では音光変換デバイス「ブリンキー」の研究を進め、光信号飽和時の信号検出方法として非負値行列因子分解を用いた方法を新たに考案した。また、ビデオカメラとブリンキーの間の距離や角度に応じた光信号のキャリブレーションを不要とするため、スマホアプリとして音光変換を行い、スマホ画面の空間パターンで信号を伝送する新たなデジタル方式のブリンキーを創出した。 C)では、多チャンネル録音の部分的欠損に頑健な音響シーン認識、距離に基づく音源分離を用いた環境音分類など、新たな観点からの展開や、音による交通量モニタリングという実応用への検討を進めた。 この他にも、動物の発声分類、音源やマイクの移動に頑健な音源分離、エイリアス信号のブラインド分離、イベント検出とシーン認識の同時最適化など、多方面に研究を展開した。
|
現在までの達成度 (段落) |
令和5年度が最終年度であるため、記入しない。
|
今後の研究の推進方策 |
令和5年度が最終年度であるため、記入しない。
|