2016 Fiscal Year Research-status Report
超狭空間指向性マイクロホンを用いた音声指令による電子機器制御
Project/Area Number |
16K21583
|
Research Institution | National Institute of Technology, Kumamoto College |
Principal Investigator |
石橋 孝昭 熊本高等専門学校, 情報通信エレクトロニクス工学科, 准教授 (60455178)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | 信号処理 / 雑音除去 |
Outline of Annual Research Achievements |
騒音環境下で電子機器を安定して音声制御をさせるための高雑音環境における雑音除去の実用化を目指している。高齢者や障害のある人が荷物や資料などを持って両手がふさがっているときに電子機器を操作したい状況を想定し、電子機器に取り付けた複数のマイクロホンを用いて、目的とする発話者に対して方向だけでなく距離に対する指向性を強化形成する手法を提案し、コンピュータシミュレーションでその有効性を確認した。音声は8kHzでサンプリングされることが多いため、8kHzでサンプリングされた音声に対し、処理単位フレーム長による分離性能を調査し、数十ミリ秒以下で分離処理できることを確認した。 周囲雑音の影響を従来のものから大幅に低減し、独自に開発した目的話者音声を短時間処理で安定してリアルタイムに抽出できるようアルゴリズムを改良し、マイクロコントローラで動作するシステムの開発を進めている。現在はパーソナルコンピュータによるシミュレーションによる検証を行っているため、今後はマイクロコントローラで実装し、実際に利用する環境下での雑音除去能力を検証する。 電動車椅子の使用者が荷物を持っていたりタブレット端末を操作していたりすることを想定し、ジョイステックの操作無しで音声指令により電動車椅子を操作できる制御システム機構を実現する。現在は、マイクロコンピュータによって電動車椅子を操作するシステムを構築しているので、このシステムに音声指令と雑音除去機能を実装する。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
研究計画は、音声入力時の雑音除去アルゴリズムの提案と、音声入力による電子機器の制御の二つの項目である。 一つ目のアルゴリズムの提案については、当初の予定通り、サンプリング周波数が8kHzのとき、数十ミリ秒よりも短い処理フレームでも機能することを確認した。研究計画では、サンプリング周波数が16kHzや44.1kHzのときに処理したときの雑音除去性能を比較しようとしていた。しかし、同じ音声を異なるサンプリング周波数で同時に収録したデータベースが存在しないこと、高周波数でサンプリングされた音声をダウンサンプリングすると厳密な提案法の有効が検証できないこと、8kHzサンプリングで有効に機能するので処理コストを不要に上げる必要がないことから、サンプリング周波数の違いによる処理性能の比較は実施していない。一方、処理フレーム長に対しては、コンピュータシミュレーションでは、事前にいくらかの学習をすることによって1ポイントのデータごとに雑音除去をできるようになり、処理の高速化を進めることができた。 二つ目の音声入力による電子機器の制御に対しては、電動車椅子に付属されているジョイスティックでは無く、マイクロコントローラによって移動を制御できるようになっている。また、12ビットの分解能で音声をマイクロコントローラに入力し、簡単な音声信号処理をして出力するデモ機も作成している。このマイクロコントローラに提案する雑音除去技術および音声認識機能を追加することで、音声による電子機器の制御が可能となる。雑音除去のアルゴリズムがシンプルであるとともに、前述のように1ポイントのデータごとに雑音除去できるため、マイクロコントローラでの実装が可能であるとともに、メモリを追加で実装しなくてもいいという期待がある。
|
Strategy for Future Research Activity |
目的とする発話者に対して方向だけでなく距離に対する指向性を強化形成する手法を新規に提案する。この手法に対しては、コンピュータ上でのシミュレーションによって有効性を確認できた。今後は反射の多い環境下での有効性を検証するとともに、そのような環境に対してのカスタマイズを進める予定である。 この技術の下で、目的話者音声を短時間処理で安定してリアルタイムに抽出するアルゴリズムを構築している。今年度は具体的に、マイクロコンピュータを利用したデモ機を作成している。今後は、音声入力のマイクロホンの選定、マイクロホンの数に対する検討、アルゴリズムが効果的に機能するためのマイクロホンの配置などについても研究を進める予定である。 電動車椅子の使用者がジョイステックの操作無しで音声指令により電動車椅子を操作できる制御システム機構を期間内に実現することを目的としている。そのため、現在は、マイクロコンピュータによって電動車椅子を操作するシステムを構築している。このシステムに音声指令と雑音除去機能を実装していく予定である。
|
Research Products
(8 results)