• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2016 Fiscal Year Research-status Report

雑音データベースを用いた高雑音下での音声強調アルゴリズムの開発

Research Project

Project/Area Number 16K18111
Research InstitutionSaitama University

Principal Investigator

杉浦 陽介  埼玉大学, 理工学研究科, 助教 (20711617)

Project Period (FY) 2016-04-01 – 2018-03-31
Keywords音声強調 / 音声解析 / 周波数推定 / ピッチ抽出 / 深層学習
Outline of Annual Research Achievements

本研究の目的は,高雑音環境下での高精度な音声強調アルゴリズムを開発することである.従来の音声強調手法は周波数領域の音声解析に基づいていた.高騒音環境下での高精度な音声強調を実現するにあたり,平成28年度の目標は,従来の音声強調手法が用いている周波数領域の音声解析に,時間領域の音声解析を統合して包括的な音声解析手法を開発することである.平成28年度の具体的な実施内容は,(1)リアルタイムかつ正確な音声解析技術の開発,および(2)音声・雑音の解析と音声強調に適した機械学習の構造の検討,の2つである.
前者の音声解析技術の開発について,以下の2つの手法を開発した.まず狭帯域信号の周波数を時間領域で正確に推定することを目的に,適応ノッチフィルタの高速・高精度なアルゴリズムの開発を行った.ノッチフィルタの構造的な解析を行ったことで,従来と比較して推定精度を最大で2倍程度向上させる手法の開発に成功した.また,音声の周波数を正確に推定することを目的に,新たなピッチ(基本周波数)抽出手法を開発した.雑音と音声の特徴量を時間,周波数の両方面から解析し,効率的に分離する技術を開発したことで,-10dBという超高騒音環境下でもピッチ正答率を70%以上維持できるようになった.
次に,後者の手法として畳み込みニューラルネットワーク(CNN)の音声強調への適用を試みた.CNNは特徴量抽出能力に長けており,画像認識に主に用いられる.本研究では,上記の音声の特徴量を解析した知見を元に,音声強調に適したCNNの構造を検討し,様々な雑音環境下でも性能を発揮できることを確認した.
これら開発した手法は,高騒音下の音声解析技術を発展させる重要な手法として位置付けしており,従来より困難とされていた時変かつ高レベルな騒音環境下での音声強調技術の発展に寄与すると期待される.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

高騒音環境下での高精度な音声強調を実現するにあたり,平成28年度の目標は,周波数領域の音声解析に時間領域の音声解析を統合してより雑音にロバストな音声解析手法を開発することであった.
現在まで,周波数領域と時間領域の両面から音声の解析を行い,狭帯域信号の周波数を高速・高精度に推定する適応ノッチフィルタアルゴリズムの開発や,音声のピッチを解析するアルゴリズムを提案した.これらの手法は,高騒音下においても信号の特徴量を高精度に推定するものであり,音声強調への応用が期待される.同時に,機械学習を用いた非線形な音声解析の実現とその音声強調への実験的な応用を行った.音声強調に適した機械学習のフレームワークを構築し,その制御に成功した.
以上より,研究はおおむね順調に進展している.

Strategy for Future Research Activity

平成29年度以降は,音声・雑音の定性的な性質の解析と,音声強調手法の確立を目指す.具体的な研究計画として,(1)雑音データベースの作成,(2)開発した音声解析技術の音声強調フレームワークへの統合,および(3)信号処理装置への実装の3つを挙げる.これらは当初の研究計画の通りである.
(1)の雑音データベースの作成では,音声強調技術が特に求められる乗用車内環境や風音の大きい環境などの雑音データの取得を行う.現在は公開されているデータベースに雑音の種類は少なく,実環境に耐えうるシステムを構築することは難しい.そこで,豊富な雑音データベースを元に,機械学習ベースの音声強調システムにおいて性能向上を目指す.
(2)においては,先に提案した音声解析手法を音声強調フレームワークに組み込むことを目指す.音声強調において,重要となる特徴量を検討するとともに,それを基に音声解析手法の更なる改善を図る.また,音声強調部のネットワーク構造を様々に検討し,更なる性能改善を目指す.具体的には,主成分分析などによる特徴量の解析や次元圧縮,構造・パラメータの最適化を行う.
(3)においては,信号処理装置への実装に先立ち,まず計算量の圧縮を検討し,リアルタイムで動作させることを目指す.次に,実機へ実装し,実環境での音声強調実験を通じて提案手法の有効性を確認する.
随時,研究成果を国内・国際会議で発表することで様々な意見を拝聴し議論することで,研究推進に役立てるとともに,技術進歩の社会への還元を行う.

Causes of Carryover

物品費について以下に説明する.今年度,音声の収録を計画に入れていたが,無償のデータベースを使用した.これにより,音声収録用機材の購入がなくなり,物品費に余裕ができた.ただし,今後の研究において新たに雑音を収録する必要があるため,来年度に機材購入を後回しにした.
次に,旅費について説明する.今年度は国際会議に参加しなかったため,その分の旅費が剰余した.ただし,来年度において2つの国際会議に参加予定であり,剰余分を使用する予定である.

Expenditure Plan for Carryover Budget

本研究を進めるにあたり,(1)雑音データベースの作成,および(2)機械学習の構造検討,が必要になる.前者において,今年度に使用しなかった音声録音機器の経費を使用する.加えて,後者において時間効率を高めるために,グラフィックカードを購入する.
また,今年度は国際会議に参加しなかったが,来年度に国際会議に2件発表予定であり,そのための費用に充てる.

  • Research Products

    (3 results)

All 2016

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (2 results)

  • [Journal Article] 適応IIR ノッチフィルタの高速・高精度な単調増加勾配アルゴリズム2016

    • Author(s)
      杉浦陽介,島村徹也
    • Journal Title

      電子情報通信学会論文誌

      Volume: J99-A Pages: 391-398

    • Peer Reviewed
  • [Presentation] 畳み込みニューラルネットワークを用いた音声強調2016

    • Author(s)
      杉浦陽介,島村徹也
    • Organizer
      第31回信号処理シンポジウム
    • Place of Presentation
      関西大学(大阪府,吹田市)
    • Year and Date
      2016-11-08 – 2016-11-10
  • [Presentation] べき乗振幅スペクトルのDCT解析に基づくピッチ抽出2016

    • Author(s)
      杉浦陽介,島村徹也
    • Organizer
      2016年ソサイエティ大会
    • Place of Presentation
      北海道大学(北海道,札幌市)
    • Year and Date
      2016-09-20 – 2016-09-23

URL: 

Published: 2018-01-16  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi