研究課題/領域番号 |
15K06116
|
研究機関 | 県立広島大学 |
研究代表者 |
生田 顯 県立広島大学, 経営情報学部, 教授 (30145164)
|
研究分担者 |
肖 業貴 県立広島大学, 経営情報学部, 教授 (50252325)
折本 寿子 (益池寿子) 県立広島大学, 経営情報学部, 講師 (80533207)
|
研究期間 (年度) |
2015-04-01 – 2018-03-31
|
キーワード | 音声信号 / 騒音抑制 / 骨導音 / 気導音 / ベイズフィルタ |
研究実績の概要 |
携帯端末やヘッドセットマイクを用い音声のみによりデータ入力を行わねばならない作業現場等に音声認識を応用することを目的とし、周囲環境騒音下で、音声信号の精密な抽出に関する新たな実用的手法の開発を目指した。具体的には、周囲騒音の影響を受けにくい骨導音(声帯で発生した音声が骨など体内を伝搬し、喉など身体表面で測定される振動)および周囲騒音の影響を受けているが、音声信号に対する全ての周波数成分を保全した気導音(口から放射される変動音圧)の両者の同時計測に基づき音声信号を抽出するための信号処理法について検討を行った。 周囲騒音のような多くの雑音変動は非ガウス型の複雑な形態を示し、一般には非白色で、観測される信号には高次の非線形相関が確実に存在している。本研究では、実環境下での音声認識を可能にするため、雑音変動のガウス性や白色性などの前提を必要とせず、しかも信号に関する高次の非線形相関情報をも考慮し、かつ音声の時間的変動形態が未知の場合でも適用できる新たな音声信号抽出法を開発することを最終目標とし、まず基礎研究として、骨導音と気導音の両者を観測することによる音声信号推定のためのベイズ原理に対する拡張を試みた。 具体的には、まず、音声信号と骨導音との関係を簡単化のため線形モデルで捉え、モデルパラメータを音声信号と同時に推定できるようベイズ定理の級数展開型表現を導出した。簡易的な実験データに導出した推定手法を適用することにより、提案した手法は音声信号を精度よく推定することが確認された。今後、さまざまなSN比のもとで実験を行い、その有効性について検討を行う。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
昨年度においては次の研究成果が得られた。 骨導音と気導音の両者を観測することによる音声信号推定のためのベイズ原理に対する拡張を試みた。具体的には、まず、音声信号と骨導音との関係を簡単化のため線形モデルで捉え、モデルパラメータを音声信号と同時に推定できるよう、信号とパラメータの同時確率密度関数に着目することによりベイズ定理の級数展開型表現を新たに導出した。その際、骨導音と気導音の両者を逐次に同時観測することを反映した条件付確率分布の形態で導出し、コンピュータ利用による逐次データ処理に整合した推定アルゴリズムを提案した。簡易的な実験データに導出した推定手法を適用することにより、提案した手法は音声信号を精度よく推定することが確認された。 また、ベイズ定理の級数展開表示に基づき新たに提案した推定手法については、これまで測定された音響データに適用することにより、その有効性を確認した。 上記の研究成果の一部については、昨年度に国内の学会で発表したが、本年度も国内・海外の専門の学会において発表の予定である。
|
今後の研究の推進方策 |
1.音声信号と骨導音との関係に対し、昨年度は簡単化のため未知パラメータを持つ線形モデルを提案したが、今後、推定精度の向上のため、音声信号の数時点間にわたる時系列と、骨導音との間の相関情報を反映した結合確率分布に着目し、各変数に関する低次・高次の各種相関情報を展開係数に反映した、級数展開表現による非線形の骨導音伝播モデルを設定する。また、この非線形モデルにおける各展開係数を未知パラメータとみなし、これらのパラメータを音声信号と同時に推定する。その際、確率のベイズ原理に非線形の骨導音伝播モデルを組み入れることにより、周囲騒音の影響を抑制し、高精度で音声信号を抽出するための新たなアルゴリズムを研究開発し、その実用化を目指す。 2.騒音存在下での実環境で有効な音声認識システムを構築するためには、音声認識システムの応用が期待されている実際の現場における音声データおよび体内伝導音を測定・分析する必要がある。様々な現場における実際の音声信号および気導音、骨導音データを計測し、SN比や音声信号、気導音、骨導音の統計量など各種パラメータ値と音声認識率の関係をまず整理・分類し、音声信号抽出法開発のための基礎的データベースを構築する。特に、アルゴリズムの適用可能範囲についての検討を、実データをもとに詳細に行う。 3.音声認識率のさらなる向上や工場等の生産の現場への応用が可能となる音声認識システムを構築し、実用化を計るためには、前年度に研究開発した骨導音および気導音の同時計測に基づく音声信号抽出法を、実際の騒音下における音声データに適用し、その実際的有効性を確認する。
|
次年度使用額が生じた理由 |
平成27年度は、周囲騒音が存在する環境下で、骨導音と気導音の同時測定に基づき、音声信号を抽出するためのアルゴリズム(ベイズイルタ)の開発を行うことに重点を置いた。特に骨導音と気導音の同時観測をいかにベイズ推定に反映させるかに焦点を於いて研究を進めた。開発したアルゴリズムの実験的検証においては、簡易的な模擬実験に留まっている。さまざまな状況下での本格的な実験は来年度に実施の予定である。本年度、骨導音と気導音の同時骨導音と気導音の同時新たに購入した備品としては振動ピックアップのみであったため、次年度使用額が生じた。
|
次年度使用額の使用計画 |
平成28年度では、新たなベイズフィルタを開発し、その有効性を実験的に確認する。ベイズフィルタによる信号抽出法の有効性を実証するためには、実際の騒音環境下で抽出された骨導音および気導音に対し、音声抽出に関する実験を繰り返し行い、性能評価を行う必要がある。現場で実際の音声信号を収録するためのマイクロフォンやワイヤレストランスミッタ等を購入の予定である。また、実験補助やデータ整理のための謝金が必要である。さらに、昨年度の研究成果の一部を、9月に開催される日本音響学会で発表する予定であり、そのための旅費に使用する。その他、国内外の学会で発表し情報収集を行うための旅費・参加費や投稿中の論文別刷り料金(掲載決定後)が必要となる予定である。
|