音響信号の振幅位相関係を考慮した複素スペクトル領域音声強調と応用
Project/Area Number |
20K19827
|
Research Category |
Grant-in-Aid for Early-Career Scientists
|
Allocation Type | Multi-year Fund |
Review Section |
Basic Section 61010:Perceptual information processing-related
|
Research Institution | Tokyo Metropolitan University |
Principal Investigator |
若林 佑幸 東京都立大学, システムデザイン研究科, 特任助教 (80826462)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Project Status |
Granted (Fiscal Year 2021)
|
Budget Amount *help |
¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000)
Fiscal Year 2023: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2022: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
Fiscal Year 2021: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2020: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
|
Keywords | 音響信号処理 / 複素領域信号処理 / 位相復元 / アレイ信号処理 / 深層学習 / 位相信号処理 / 振幅・位相関連性 / 音声区間検出 / 複素スペクトル / 振幅位相復元 / 音声強調 |
Outline of Research at the Start |
本研究は,特に周囲の雑音により音質の劣化した音響信号の強調・復元に取り組むものである.近年の音響信号処理では信号の振幅スペクトル,位相スペクトルという二つの特徴に着目し,個別で処理するものが一般的であるが,理論・実験の両面からこれらのスペクトルは強い関係性を持つことが示唆されている.この関係性に着目し,振幅・位相を統合的に取り扱うための基礎理論を構築し,信号処理へ応用する.
|
Outline of Annual Research Achievements |
本研究の目的は,音響信号の周波数解析によって得られる振幅スペクトルと位相スペクトルの関連性を考慮した音響信号強調手法の基礎理論構築とその他の音響信号処理への応用であり,情報社会の発展に大きく貢献するものである. 従来の研究では,音響信号の時間周波数解析に基づき,振幅・位相という二つのスペクトルの挙動を利用して各種信号処理の理論・アルゴリズムの構築がなされる.本研究ではこれら二つのスペクトルに深い関連があることに着目した信号処理の理論構築と実験を行うものである. 第二年度では,一点目として,初年度で行った時間・周波数領域における振幅と位相の統計的挙動の関係性を発展させるために,現在様々な工学分野で注目されている深層学習への応用に取り組んだ.本取り組みでは,深層学習と典型的な最適化手法とを組み合わせることで,似たアプローチを取った従来研究よりも位相スペクトルの推定性能が改善することを実験的に確認し,国内会議(日本音響学会秋季研究発表会)にて発表した.また,最適化手法をさらに発展させ,国際学会APSIPAへも投稿し,採択された.この成果と追加実験とを併せ,学術雑誌論文を投稿する準備を進めている. 二点目として,本課題とは別の課題で研究代表者が取り組んだ研究成果技術を振幅・位相推定に応用する試みを行った.本研究は複数のマイクロホンを用いた信号処理において鍵となるステアリングベクトルの推定を行うものである.このベクトルは時間・周波数領域で定義されるため,振幅・位相の値を求めることが重要であり,本課題とは関連がある.別課題の技術との連携により,本課題推進の一助となる実験成果を得た.本成果は国内会議(日本音響学会秋季研究発表会)にて発表した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
初年度にてに取り組んだ研究成果をさらに発展させ,近年注目の深層学習と連携し成果を確認できた事が一つ目の理由である.この研究は英文論文誌への投稿に目処が立っており大きな成果と言える. また,当初の予定とは異なるものの,他課題の技術を本課題にも応用できる可能性を示す実験結果が得られたため,応用範囲が拡大された. 一方,初年度から取り組んでいる,振幅と位相の関連性を考慮した複素数領域での音響信号強調手法の基礎理論構築については大きな進捗が得られていないため,予想以上の成果が得られたわけではない.
|
Strategy for Future Research Activity |
進捗状況でも記述したとおり,実績一点目に関する2022年度早期の論文投稿を目指す. 実績二点目に関する論文も進めており,2022年度早期の投稿を予定している. また,本年度は特に,振幅と位相の関連性を考慮した複素数領域での音響信号強調手法の基礎理論構築について中心的に取り組み,まとまった結果が出次第,国内外の学会への投稿を目指す.具体的には国内ならば日本音響学会・電子情報通信学会,国外ならばICASSPやAPSIPAなどの著名な査読付き学会である.その後査読付き英語学術論文誌への投稿を目指す.本理論は応用分野が多いことが予想されるため,様々な信号処理への展開が期待できる.
|
Report
(2 results)
Research Products
(5 results)