研究課題/領域番号 |
15K06116
|
研究機関 | 県立広島大学 |
研究代表者 |
生田 顯 県立広島大学, 経営情報学部, 教授 (30145164)
|
研究分担者 |
肖 業貴 県立広島大学, 経営情報学部, 教授 (50252325)
折本 寿子 (益池寿子) 県立広島大学, 経営情報学部, 講師 (80533207)
|
研究期間 (年度) |
2015-04-01 – 2018-03-31
|
キーワード | 音声信号 / 騒音抑制 / 骨導音 / 気導音 / ベイズフィルタ |
研究実績の概要 |
携帯端末やヘッドセットマイクを用い音声のみによりデータ入力を行わねばならない作業現場等に音声認識を応用することを目的とし、周囲環境騒音下で、音声信号の精密な抽出に関する新たな実用的手法の開発を目指した。 特に、実環境下での音声認識を可能にするため、周囲騒音のガウス性や白色性などの前提を必要とせず、しかも信号に関する高次の非線形相関情報をも考慮し、かつ騒音の統計的性質が未知の場合でも適用できる新たな音声信号抽出法の開発を目指した。具体的には、周囲騒音の影響を受けにくい骨導音、および周囲騒音の影響を受けるが音声信号に対する全ての周波数成分を保全した気導音の両者の同時計測に基づき、音声信号を抽出するための信号処理法について検討を行った。 まず、音声信号と骨導音との関係を簡単化のため線形モデルで捉え、モデルパラメータを音声信号と同時に推定できるようベイズ定理の級数展開型表現を導出した。次に、音声信号と骨導音・気導音との間の相関情報を反映した結合確率分布に着目し、各変量に関する低次・高次の各種相関情報を展開係数に反映した、級数展開表現による非線形の骨導音および気導音に対する伝播モデルを設定した。さらに、この非線形モデルにおける各展開係数を未知パラメータとみなし、これらのパラメータを音声信号と同時に推定した。その際、確率のベイズ原理に骨導音および気導音に対する非線形伝播モデルを組み入れることにより、周囲騒音の影響を抑制し、高精度で音声信号を抽出するための新たなアルゴリズム(ベイズフィルタ)を研究開発した。 また、実際の音声信号および骨導音、気導音データを計測し、SN比や音声信号、骨導音、気導音の統計量など各種パラメータ値と音声信号推定精度の関係を整理・分類し、高性能の音声信号抽出法開発のための基礎的データベースを構築した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
平成27年度に導出した骨導音と気導音の両者を観測することによる音声信号推定法を、より現実の状況に整合した形態に拡張した。具体的には、これまで導出した推定アルゴリズムでは、音声信号と骨導音との関係を簡単化のため線形モデルで捉えていた。また、音声信号に対し外来騒音の加法性を仮定しその統計量は既知としていた。平成28年度は、音声信号と骨導音の関係、および音声信号と気導音の関係をそれぞれ条件付き確率分布の級数展開表現で捉えることにより、非線形システムにも対応できる形態で拡張した。その際、条件付き確率分布に含まれる各相関情報を未知パラメータと見なし音声信号と同時に推定できるよう、信号とパラメータの同時確率密度関数に着目することによりベイズ定理の級数展開型表現を新たに導出した。また、骨導音と気導音の両者を逐次に同時観測することを反映した条件付確率分布の形態で導出し、コンピュータ利用による逐次データ処理に整合した推定アルゴリズムを提案した。無響室で測定した実験データに、導出した推定手法を適用することにより、提案した手法は音声信号を精度よく推定できることを確認した。さらに、ベイズ定理の級数展開表示に基づき新たに提案した推定手法の有効性を、これまで測定した各種音響データに適用することにより実験的にも確認した。 上記の研究成果については、国内・海外の専門の学会において発表の予定である。
|
今後の研究の推進方策 |
音声認識率のさらなる向上や工場等の生産の現場への応用が可能となる音声認識システムを構築し実用化を計るためには、平成28年度までに研究開発した骨導音および気導音の同時計測に基づくベイズフィルタを、実際の騒音下における音声データに適用し、その実際的有効性を確認する必要がある。骨導音計測のための最適なピックアップ配置位置についても検討を行う。また、アルゴリズムの適用可能範囲についての検討を、実データをもとに詳細に行う。 次に、平成28年度にまで開発した骨導音および気導音に関する非線形伝播モデルをもとに、例えば、さらに次数を増やすなどによりモデルの精密化を図る。また、現実の骨導音計測においては、高周波域における減衰の影響が無視できず、音声認識率のさらなる向上を目指し、骨導音伝播モデルにおいて、(高周波と結びつく)より高次の相関情報を考慮することにより、提案した音声信号抽出法(ベイズフィルタ)の適用可能性の拡大について検討を行う。通常の確定論でなく確率論にもとづく本手法は、音場の不確実性に対しても柔軟に対応可能であり、その有効性が期待される。 さらに、開発・改良した音声信号抽出法を、再度、実際の現場へ適用し実用化への検討を行う。具体的には、音声認識が必要とされる両手作業・狭い場所・暗い場所などペーパー使用不可能な状況における作業記録・情報伝達において、作業の安全性や効率性に関連する、ユーザの明瞭度評価や了解度評価を行い実用化における問題点の解決を図る。
|
次年度使用額が生じた理由 |
平成28年度は、周囲騒音が存在する環境下で、骨導音と気導音の同時測定に基づき、音声信号を抽出するためのアルゴリズム(ベイズイルタ)を、現実の状況に整合した形態で開発することに重点を置いた。特に、一般に非線形特性を示す音声信号と骨導音・気導音の関係を条件付き確率密度関数で捉え、これをいかにベイズ推定に反映させるかに焦点を於いて研究を進めた。開発したアルゴリズムの実験的検証においては、簡易的な模擬実験に留まっている。さまざまな状況下での本格的な実験は平成29年度に実施の予定である。本年度、新たに購入した備品としては計測に使用するノートパソコンのみであったため、次年度使用額が生じた。
|
次年度使用額の使用計画 |
平成29年度では、開発したベイズフィルタの有効性を実験的に確認する。ベイズフィルタによる信号抽出法の有効性を実証するためには、実際の騒音環境下で抽出された骨導音および気導音に対し、音声抽出に関する実験を繰り返し行い、性能評価を行う必要がある。現場で実際の骨導音と気導音を収録するための小型のピックアップ・マイクロフォン、データレコーダ等を購入の予定である。また、実験補助やデータ整理のための謝金が必要である。さらに、昨年度の研究成果の一部を、日本音響学会で発表する予定であり、そのための旅費に使用する。その他、国内外の学会で発表し情報収集を行う。
|