研究課題/領域番号 |
16H01735
|
研究機関 | 国立情報学研究所 |
研究代表者 |
小野 順貴 国立情報学研究所, 情報学プリンシプル研究系, 准教授 (80334259)
|
研究分担者 |
牧野 昭二 筑波大学, 生命領域学際研究センター, 教授 (60396190)
猿渡 洋 東京大学, 大学院情報理工学系研究科, 教授 (30324974)
小山 翔一 東京大学, 大学院情報理工学系研究科, 助教 (80734459)
|
研究期間 (年度) |
2016-04-01 – 2020-03-31
|
キーワード | 非同期 / 分散 / マイクアレー / 音源定位 / マイク定位 / 音源分離 |
研究実績の概要 |
1) 到来時間差に基づくマイク・音源の同時位置推定法について引き続き研究を進め、成果をまとめた論文がトップジャーナルに掲載された。2) 到来時間差に基づくマイク・音源の同時位置推定法について引き続き研究を進め、成果をまとめた論文がトップジャーナルに掲載された。また、メディアンフィルタを用いて実環境での位置推定をロバストに行う新しい手法を提案した。3) スマートフォンが音を発信することを利用し、録音機器間の距離とサンプリング周波数ミスマッチを同時に推定する手法を提案した。 4) 時間チャンネル領域での非負値行列因子分解を用いた振幅ベースの音声強調法が、同期ずれに頑健であること、また複数の遠方音源をまとめて除去できることを示した。5) 音響イベント検出のために、空間ケプストラムを発展させ、スペクトル特徴と空間情報を同時に表現する一般化空間ケプストラムという手法を提案した。この成果をまとめた論文がトップジャーナルに掲載された。また、基本的な音響イベント検出の性能向上のため、DNN-GMMと連結特徴量を用いる手法を提案した。 6) ブラインド同期の応用システムとして、複数台のiPhoneを用いた複数話者同時音声認識システムを構築し、認識性能を評価した。この成果をまとめた論文が音声分野のトップ会議に採録された。デモ動画も公開した。また、自閉症の音声収録、音声解析にも分散マイクアレーを応用した。7) 音源定位手法の性能向上のため、独立低ランク行列分析にスパース時系列正則化を行った場合の効率的な解放について検討した。またスパース性を利用した高速化について検討した。8) 音源強調手法の性能向上のため、ヴァーチャル多素子化に基づく SN 比最大化ビームフォーマの残響に対する性能変化について調査した。9) 分散スピーカアレイにも適用可能な音場再現手法を導出し、その有用性を確認した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
学術的な成果としては、ジャーナル論文6編(うち3編はIEEE Trans.のトップジャーナル論文)、国際会議論文9編(うち5編は、ICASSP, INTERSPEECH, EUSIPCOというトップ会議論文)、国内学会発表8件が得られた。また、国内では音声研究会で招待講演を行い、フランスのTelecom Paristechでも非同期マイクアレーに関するトークを行った。複数話者同時音声認識については、筑波大学と共同でプレスリリース(http://www.nii.ac.jp/news/2016/0929/)を行い、関連して小野が朝日新聞3月12日朝刊35面に取材協力を行ったり、JST Science Window 2017春号 p.18に取り上げられるなど、波及して複数メディアに取り上げられるなど、計画以上の大きな成果が生まれたため。
|
今後の研究の推進方策 |
1) サンプリング周波数ミスマッチを時間周波数領域での時変位相回転として定式化し、非同期アレイの同期化と音源分離を統一的な目的関数により行う非同期アレー信号処理理論の定式化を行う。2) 非同期マイクアレーの応用システムの一つである、複数話者同時音声認識システムについて評価を進め、ジャーナル論文としての出版を目指す。3) 時間チャンネル領域での非負値行列因子分解による音源強調について、スペクトル情報も利用した手法への拡張を検討する。4) 音源分離性能の基本的な向上を目的に、ヴァーチャル多素子化によるアレイ信号処理についても検討を進める。
|
備考 |
(1)は本科研成果により得られたプレスリリース
|