• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2017 Fiscal Year Research-status Report

超狭空間指向性マイクロホンを用いた音声指令による電子機器制御

Research Project

Project/Area Number 16K21583
Research InstitutionNational Institute of Technology, Kumamoto College

Principal Investigator

石橋 孝昭  熊本高等専門学校, 情報通信エレクトロニクス工学科, 准教授 (60455178)

Project Period (FY) 2016-04-01 – 2019-03-31
Keywords信号処理 / 雑音除去
Outline of Annual Research Achievements

騒音環境下で電子機器を安定して音声制御をさせるための高雑音環境における雑音除去の実用化を目指している。高齢者や障害のある人が荷物や資料などを持って両手がふさがっているときに電子機器を操作したい状況を想定し、電子機器に取り付けた複数のマイクロホンを用いて、目的とする発話者に対して方向だけでなく距離に対する指向性を強化形成する手法を新規に提案し、コンピュータシミュレーションによって提案法の有効性を確認した。音声は8kHzでサンプリングされることが多いため、8kHzでサンプリングされた音声に対し、処理単位フレーム長による分離性能を調査し、数十ミリ秒いかで分離処理できることを確認した。
周囲雑音の影響を従来のものから大幅に低減し、独自に開発した目的話者音声を短時間処理で安定してリアルタイムに抽出できるようにアルゴリズムを改良しており、マイクロコントローラで実装することにも着手した。実際には2チャンネルのマイクロホンで複数方向へ任意のマイクの指向性を作成するアルゴリズムを開発した。
高雑音環境下での電動車椅子の使用者が荷物を持ってタブレット端末を操作することを想定し、ジョイステックの操作なしで音声指令により電動車椅子を操作できる制御システム機構を実現する計画である。実際には、本開発システムによって雑音除去された音声信号を既存の音声認識機器に送ることで、音声認識結果が送り返され、その信号に基づいて電動車椅子へ制御信号を伝えるシステムを構築する。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

本研究計画は、音声入力時の雑音除去アルゴリズムの提案と、音声入力による電子機器の制御の二つの項目である。
一つ目のアルゴリズムの提案については、8kHzでサンプリングされた音声に対してコンピュータシミュレーションによって提案法の有効性を確認した。また、マイクロコントローラで実装することにも着手した。実際には2チャンネルのマイクロホンで複数方向へ任意のマイクの指向性を作成するアルゴリズムを開発した。現在、周囲雑音の影響を従来のものから大幅に低減し、独自に開発した目的話者音声を短時間処理で安定してリアルタイムに抽出できるようにアルゴリズムを改良しているところである。
二つ目の音声入力による電子機器の制御については、どの音声認識機器に提案するアルゴリズムを実装するかについて検討を進めている状況である。音声認識技術の搭載された機器を見ると、音声入力方式、マイコン実装方式、スマートフォンなどのアプリ方式などがあるため、音声認識機器の選択によっては、現在のシステムの開発環境を変更することも視野に入れなければならない。

Strategy for Future Research Activity

本研究目的の音声入力時の雑音除去アルゴリズムの提案については順調に進んでいる。もう一つの音声入力による電子機器の制御について、さらに研究を進める予定である。この数年で音声認識技術の実装が大きく進化しており、現在、音声認識技術の搭載された機器を見ると、音声入力方式、マイコン実装方式、スマートフォンなどのアプリ方式などがある。そのため、どの音声認識機器に提案するアルゴリズムを実装するかについて検討を進めている状況である。電動車椅子の制御を考慮すると、OSの稼働するシステムであると、トラブル時の再起動で全く動けなくなってしまう恐れがある。したがって、マイコンで実装して電子回路に制御信号を送るシステムを開発したいと考えている。

  • Research Products

    (8 results)

All 2018 2017 Other

All Journal Article (3 results) (of which Peer Reviewed: 3 results,  Open Access: 3 results) Presentation (4 results) (of which Int'l Joint Research: 4 results) Remarks (1 results)

  • [Journal Article] Two-channel microphone system with variable arbitrary directional pattern2018

    • Author(s)
      C. Okuma, K. Hayama and T. Ishibashi
    • Journal Title

      ICIC Express Letters

      Volume: 12 Pages: 229-236

    • DOI

      10.24507/icicel.12.03.229

    • Peer Reviewed / Open Access
  • [Journal Article] Target Human Speech Extraction Method Based on Silent Interval Detection2017

    • Author(s)
      T. Ishibashi, K. Higuchi and C. Okuma
    • Journal Title

      ICIC Express Letters, Part B: Applications

      Volume: 8 Pages: 1603-1610

    • DOI

      10.24507/icicelb.08.12.1603

    • Peer Reviewed / Open Access
  • [Journal Article] Fast Blind Source Separation and Target Human Speech Extraction Method for Acoustic Signals2017

    • Author(s)
      T. Ishibashi H. Shintani and K. Nagata
    • Journal Title

      ICIC Express Letters

      Volume: 11 Pages: 1715-1721

    • Peer Reviewed / Open Access
  • [Presentation] Blind Source Separation and Human Speech Extraction for Three Sound Sources Using Silent Interval2017

    • Author(s)
      K. Higuchi, C. Okuma and T. Ishibashi
    • Organizer
      IIAE International Conference on Intelligent Systems and Image Processing
    • Int'l Joint Research
  • [Presentation] Two-Channel Microphone System with Variable Arbitrary Directional Pattern2017

    • Author(s)
      C. Okuma, K. Hayama and T. Ishibashi
    • Organizer
      International Conference on Innovative Computing, Information and Control
    • Int'l Joint Research
  • [Presentation] Silent Interval Detection and Target Human Speech Extraction2017

    • Author(s)
      K. Higuchi, C. Okuma and T. Ishibashi
    • Organizer
      International Conference on Innovative Computing, Information and Control
    • Int'l Joint Research
  • [Presentation] Blind Source Separation and Target Speech Extraction for Acoustic Signals2017

    • Author(s)
      T. Ishibashi, S. Nakao and K. Nagata
    • Organizer
      International Conference on Innovative Computing, Information and Control
    • Int'l Joint Research
  • [Remarks] 熊本高等専門学校 教員紹介

    • URL

      http://www.kumamoto-nct.ac.jp/gyouseki/1000029.html

URL: 

Published: 2018-12-17  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi