研究課題/領域番号 |
18H06482
|
配分区分 | 補助金 |
研究機関 | 首都大学東京 |
研究代表者 |
若林 佑幸 首都大学東京, システムデザイン研究科, 特任助教 (80826462)
|
研究期間 (年度) |
2018-08-24 – 2020-03-31
|
キーワード | 音声信号復元 / 位相 / 音声強調 / 雑音除去 |
研究実績の概要 |
本研究の目的は,雑音によって劣化した音声信号から雑音の影響を除去し,真の音声信号を復元する理論の構築とその応用である. 従来より,音声信号の振幅・位相という二つの特徴に基いた復元アルゴリズムを構築するのが一般的である.本研究ではこれら二つの特徴に深い関連があることに着目し,新しい復元理論の構築を行った. 本年度では,時間・周波数領域において振幅と位相が同期するという,全く注目されていなかった従属関係を復元理論に取り組み,新たなアルゴリズム構築を行った.具体的には,これまでの信号処理では振幅と位相は異なる手法により復元されるのが一般的であったが,本研究ではまず位相を復元した後に,その値を用いて振幅を統計的に推定するアルゴリズムを構築した.このアルゴリズムにより雑音を除去し,客観的に評価することで復元音声品質の向上が確認できた.この成果を音響信号処理に関わる国内・国際学会で発表し,様々な研究者と実験結果の解釈や次への展開について議論した.学会参加費や開催地への旅費に本補助金を利用した.国際学会への投稿においては英文校閲機関への依頼を行い,英語論文の品質を向上させた.また,これまでに申請者が取り組んだ信号復元アルゴリズムの内容が評価され,日本音響学会誌の小特集「位相を考慮した信号処理」の著者として選ばれ,特集号に寄稿した.応用音響研究会においても位相を考慮した信号処理に関する内容の招待講演を行い,本分野を広く説明した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
順調に進んでいる理由としては,本研究の目的である,雑音の重畳した音声から真の音声信号を復元する理論の構築において成果が見られたこと,またその応用において今後の発展を示唆する予備実験成果が確認できたことが挙げられる. 一つ目に対しては,本研究の鍵となる「音声信号の振幅と位相という二つの特徴に深い関連がある」ことに着目した復元理論の構築を行い,このアルゴリズムにより雑音除去することが確認できた.アルゴリズムと併せて客観的な音質の評価結果を音響信号処理に関わる査読付きの国際学会に投稿し,受理されたことで,一定の成果を得ることができた.また,現状進捗が出ているわけではないが,本結果と対になる研究のアイデアと簡単な予備実験を行い,今後の展望が見られた. 二つ目に対しては,上記振幅と位相の関連性の他の応用候補として,基本的な音響信号処理の一つである音声区間検出への応用を並行に推進したところ,充分に応用可能な予備実験結果が多数得られた.音声区間検出の分野でも,本関連性に着目した研究はなく,全く新しい手法の提案ができると期待できる.現在は本内容の基本的な評価を行っている段階である.
|
今後の研究の推進方策 |
進捗状況でも記述したとおり,主目的である雑音除去の研究と,副目的である他の音響信号処理への応用の二面において,基本的なアイデアを考案し,簡単な予備実験を実施したところ,今後の発展が期待できる実験結果が得られている. 第一の研究では,位相の挙動を振幅推定に利用した本年度のものと対になる,振幅の変動を位相推定に利用することを考案している.このアプローチ自体は古くから取り組まれたもので多くの先行研究があるが,それを発展させることを考えている. 第二の研究では,振幅の挙動と位相の挙動が連動していることに着目して,対象信号が音声であるかどうかを識別するものである.振幅特徴のみで行うのが一般的であるが,現調査では位相特徴を利用した研究はない.位相の挙動を捉えるのは困難であることが知られているが,時間周波数領域における微分値を利用することで可能となることを暗示する実験結果が得られている.この結果を基にアルゴリズムを構築する予定である. これら二つの研究を並行し,それぞれ国内外の学会,特に査読付きの国際学会で発表することを当初の目的とし,その後に学術論文雑誌に投稿することを考えている.
|