• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2022 Fiscal Year Research-status Report

目的音と雑音の増減する環境下でのバリアフリー音声収録システムの開発

Research Project

Project/Area Number 20K12763
Research InstitutionAriake National College of Technology

Principal Investigator

石橋 孝昭  有明工業高等専門学校, 創造工学科, 准教授 (60455178)

Project Period (FY) 2020-04-01 – 2024-03-31
Keywords音声信号処理 / 雑音除去 / 目的音抽出
Outline of Annual Research Achievements

騒音のある環境で、音声を聞き取りづらい障がい者や高齢者と一緒に会話できるために、雑音が存在する環境での雑音除去機器の実用化を目指している。本研究で想定する雑音環境は、一般的な家庭やオフィスの室内を想定しており、雑音の開始や終了、パワーの変化、音源位置の移動がある動的な音環境である。このような音環境でも、会話相手以外の音が気になる者や、相手の声が聞こえづらい者がいることは周知の事実である。そのため、特定の音声だけを強調して、それ以外の音を抑制できる音声収録システムを実現を目指している。
本研究の目的は、音環境の変動に追従できる雑音除去システムの開発である。音環境の変動とは、目的話者の発話の有無、雑音の開始や終了、音源の移動のことである。観測された複数の音の混じった音声情報だけを手掛かりとして、音源の数や位置を推定して、目的音声だけを抽出し雑音を抑制するシステムを構築することが本研究の到達点である。さらに、シングルボードコンピュータやマイコンなどで本アルゴリズムを実装して、リアルタイムで周囲の雑音を抑制した目的音声を抽出することを目的としている。
本研究では、音環境の変動を解析後、リアルタイム雑音除去システムを適用して、目的音声を追従して強調できる補聴器のような音声収録システムの実現を進めている。音源の移動の無い環境での音源数を推定する方法や音源分離の方法を提案した。現在は、目的音声が雑音に埋もれた音環境において、発話の開始や終了のある音声データを用いて、目的音声のみを抽出する方法を検討している。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

実際に発話をしたときの音声データを取得する実験を計画していたが、複数人が集まって同時に声を出す実験ができなかった。また、研究機関での異動があり、研究室の再立ち上げや研究設備の環境を整えることに時間を要した。そのような状況の下でも、研究成果の発表ができている。

Strategy for Future Research Activity

本研究の目的は、音環境の変動に追従できる雑音除去システムの開発である。音環境の変動とは、目的話者の発話の有無、雑音の開始や終了、音源の移動のことである。音源の数の推定方法を提案し、目的音声の方位が分かるときには、目的音声を抽出し雑音を抑制するシステムを提案した。今後は、発話の開始や終了の情報を推定するとともに、雑音に埋もれた発話音声の復元を進めていく。

Causes of Carryover

研究機関を異動したため、予定していた研究計画の変更をしなければならなくなったため。
データ整理のための謝金等を計画していたが、雇用ができなかった。雇用できる機会をうかがっているところである。

  • Research Products

    (4 results)

All 2023 2022

All Journal Article (2 results) (of which Peer Reviewed: 2 results,  Open Access: 1 results) Presentation (2 results) (of which Int'l Joint Research: 1 results)

  • [Journal Article] Voice Activity Detection Based on Correlation of Joint Distribution of Observed Mixture Signals2023

    • Author(s)
      T. Ishibashi, T. Shimoda and K. Eguchi
    • Journal Title

      ICIC Express Letters, Part B: Applications

      Volume: 14 Pages: 323-330

    • DOI

      10.24507/icicelb.14.03.323

    • Peer Reviewed
  • [Journal Article] Speech estimation method without sign indetermination based on blind source separation using rotation2022

    • Author(s)
      T. Ishibashi and K. Eguchi
    • Journal Title

      ICIC Express Letters, Part B: Applications

      Volume: Vol. 13, No. 5 Pages: 471-478

    • DOI

      10.24507/icicelb.13.05.471

    • Peer Reviewed / Open Access
  • [Presentation] Voice Activity Detection Using Correlation of Distribution of Observed Signals2022

    • Author(s)
      T. Shimoda, K. Eguchi and T. Ishibashi
    • Organizer
      16th International Conference on Innovative Computing, Information and Control
    • Int'l Joint Research
  • [Presentation] 強雑音環境における発話区間の推定2022

    • Author(s)
      下田匠海, 石橋孝昭
    • Organizer
      第30回電子情報通信学会九州支部学生会講演会

URL: 

Published: 2023-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi