• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2017 年度 実施状況報告書

超狭空間指向性マイクロホンを用いた音声指令による電子機器制御

研究課題

研究課題/領域番号 16K21583
研究機関熊本高等専門学校

研究代表者

石橋 孝昭  熊本高等専門学校, 情報通信エレクトロニクス工学科, 准教授 (60455178)

研究期間 (年度) 2016-04-01 – 2019-03-31
キーワード信号処理 / 雑音除去
研究実績の概要

騒音環境下で電子機器を安定して音声制御をさせるための高雑音環境における雑音除去の実用化を目指している。高齢者や障害のある人が荷物や資料などを持って両手がふさがっているときに電子機器を操作したい状況を想定し、電子機器に取り付けた複数のマイクロホンを用いて、目的とする発話者に対して方向だけでなく距離に対する指向性を強化形成する手法を新規に提案し、コンピュータシミュレーションによって提案法の有効性を確認した。音声は8kHzでサンプリングされることが多いため、8kHzでサンプリングされた音声に対し、処理単位フレーム長による分離性能を調査し、数十ミリ秒いかで分離処理できることを確認した。
周囲雑音の影響を従来のものから大幅に低減し、独自に開発した目的話者音声を短時間処理で安定してリアルタイムに抽出できるようにアルゴリズムを改良しており、マイクロコントローラで実装することにも着手した。実際には2チャンネルのマイクロホンで複数方向へ任意のマイクの指向性を作成するアルゴリズムを開発した。
高雑音環境下での電動車椅子の使用者が荷物を持ってタブレット端末を操作することを想定し、ジョイステックの操作なしで音声指令により電動車椅子を操作できる制御システム機構を実現する計画である。実際には、本開発システムによって雑音除去された音声信号を既存の音声認識機器に送ることで、音声認識結果が送り返され、その信号に基づいて電動車椅子へ制御信号を伝えるシステムを構築する。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

本研究計画は、音声入力時の雑音除去アルゴリズムの提案と、音声入力による電子機器の制御の二つの項目である。
一つ目のアルゴリズムの提案については、8kHzでサンプリングされた音声に対してコンピュータシミュレーションによって提案法の有効性を確認した。また、マイクロコントローラで実装することにも着手した。実際には2チャンネルのマイクロホンで複数方向へ任意のマイクの指向性を作成するアルゴリズムを開発した。現在、周囲雑音の影響を従来のものから大幅に低減し、独自に開発した目的話者音声を短時間処理で安定してリアルタイムに抽出できるようにアルゴリズムを改良しているところである。
二つ目の音声入力による電子機器の制御については、どの音声認識機器に提案するアルゴリズムを実装するかについて検討を進めている状況である。音声認識技術の搭載された機器を見ると、音声入力方式、マイコン実装方式、スマートフォンなどのアプリ方式などがあるため、音声認識機器の選択によっては、現在のシステムの開発環境を変更することも視野に入れなければならない。

今後の研究の推進方策

本研究目的の音声入力時の雑音除去アルゴリズムの提案については順調に進んでいる。もう一つの音声入力による電子機器の制御について、さらに研究を進める予定である。この数年で音声認識技術の実装が大きく進化しており、現在、音声認識技術の搭載された機器を見ると、音声入力方式、マイコン実装方式、スマートフォンなどのアプリ方式などがある。そのため、どの音声認識機器に提案するアルゴリズムを実装するかについて検討を進めている状況である。電動車椅子の制御を考慮すると、OSの稼働するシステムであると、トラブル時の再起動で全く動けなくなってしまう恐れがある。したがって、マイコンで実装して電子回路に制御信号を送るシステムを開発したいと考えている。

  • 研究成果

    (8件)

すべて 2018 2017 その他

すべて 雑誌論文 (3件) (うち査読あり 3件、 オープンアクセス 3件) 学会発表 (4件) (うち国際学会 4件) 備考 (1件)

  • [雑誌論文] Two-channel microphone system with variable arbitrary directional pattern2018

    • 著者名/発表者名
      C. Okuma, K. Hayama and T. Ishibashi
    • 雑誌名

      ICIC Express Letters

      巻: 12 ページ: 229-236

    • DOI

      10.24507/icicel.12.03.229

    • 査読あり / オープンアクセス
  • [雑誌論文] Target Human Speech Extraction Method Based on Silent Interval Detection2017

    • 著者名/発表者名
      T. Ishibashi, K. Higuchi and C. Okuma
    • 雑誌名

      ICIC Express Letters, Part B: Applications

      巻: 8 ページ: 1603-1610

    • DOI

      10.24507/icicelb.08.12.1603

    • 査読あり / オープンアクセス
  • [雑誌論文] Fast Blind Source Separation and Target Human Speech Extraction Method for Acoustic Signals2017

    • 著者名/発表者名
      T. Ishibashi H. Shintani and K. Nagata
    • 雑誌名

      ICIC Express Letters

      巻: 11 ページ: 1715-1721

    • 査読あり / オープンアクセス
  • [学会発表] Blind Source Separation and Human Speech Extraction for Three Sound Sources Using Silent Interval2017

    • 著者名/発表者名
      K. Higuchi, C. Okuma and T. Ishibashi
    • 学会等名
      IIAE International Conference on Intelligent Systems and Image Processing
    • 国際学会
  • [学会発表] Two-Channel Microphone System with Variable Arbitrary Directional Pattern2017

    • 著者名/発表者名
      C. Okuma, K. Hayama and T. Ishibashi
    • 学会等名
      International Conference on Innovative Computing, Information and Control
    • 国際学会
  • [学会発表] Silent Interval Detection and Target Human Speech Extraction2017

    • 著者名/発表者名
      K. Higuchi, C. Okuma and T. Ishibashi
    • 学会等名
      International Conference on Innovative Computing, Information and Control
    • 国際学会
  • [学会発表] Blind Source Separation and Target Speech Extraction for Acoustic Signals2017

    • 著者名/発表者名
      T. Ishibashi, S. Nakao and K. Nagata
    • 学会等名
      International Conference on Innovative Computing, Information and Control
    • 国際学会
  • [備考] 熊本高等専門学校 教員紹介

    • URL

      http://www.kumamoto-nct.ac.jp/gyouseki/1000029.html

URL: 

公開日: 2018-12-17  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi