研究課題/領域番号 |
15K06116
|
研究機関 | 県立広島大学 |
研究代表者 |
生田 顯 県立広島大学, 経営情報学部, 名誉教授 (30145164)
|
研究分担者 |
肖 業貴 県立広島大学, 経営情報学部, 教授 (50252325)
折本 寿子 (益池寿子) 県立広島大学, 経営情報学部, 准教授 (80533207)
|
研究期間 (年度) |
2015-04-01 – 2019-03-31
|
キーワード | 音声信号 / 騒音抑制 / 骨導音 / 気導音 / ベイズフィルタ |
研究実績の概要 |
例えば、作業現場のようにパソコンなどが設置できず、携帯端末やヘッドセットマイクを用い音声のみによりデータ入力を行わねばならない環境において音声認識を実現するためには、周囲環境騒音下で、音声信号の精密な抽出に関する新たな実用的手法の開発が必要である。 本研究では、騒音源の方向が特定できない高騒音環境下において、騒音スペクトルの事前情報やピッチ検出が不要な時間領域における騒音抑制法について研究開発した。具体的には、実環境下での音声認識を可能にするため、骨導音および気導音の同時計測に基づき、音声信号を精密に抽出するための信号処理法を、確率のベイズ定理を駆使することにより導出した。 骨導音は周囲の騒音が混入しにくい個体伝搬音であるが、伝搬課程で高周波成分が減衰する。一方、気導音は空気伝搬音であるため、周囲からの騒音の混入は避けられないが、全ての周波数成分が保全され含まれている。したがって、両者の併用により、音声信号のみを精密に推定することが可能である。 まず、音声信号と気導音の関係は音圧の加法性により線形モデルで捉え、音声信号と骨導音との関係は、未知パラメータを含む非線形モデルで捉え、モデルパラメータを音声信号と同時に推定できるよう条件付き結合確率分布に対するベイズ定理にまず着目した。次に、音声信号・骨導音・気導音との間の低次・高次の各種相関情報を展開係数に反映した級数展開型のベイズ表現を導出した。さらに、展開型ベイズ定理に骨導音および気導音に対する線形および非線形モデルを組み入れることにより、周囲騒音の影響を抑制し、高精度で音声信号を抽出するための新たなアルゴリズム(ベイズフィルタ)を研究開発した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
平成29年度は、まず平成28年度に導出した骨導音と気導音の両者を観測することによる騒音混入下での音声信号推定法を、理想的な無響室および現実の住環境で測定した音声信号(女声信号および男声信号)に適用し、その有効性を実験的に確認した。その際、騒音の大きさを(音のエネルギーの尺度で)信号の1倍、2倍、3倍、4倍、5倍、10倍と変化させ、それぞれの場合の推定精度を2種類の評価尺度を用い詳細に検討した。これらの研究成果については、国内・海外の専門の学会において発表の予定である。 さらに、音声信号と骨導音の関係を条件付き確率分布の級数展開表現で捉えることにより新たな推定アルゴリズムを研究開発した。その際、条件付き確率分布に含まれる各相関情報を未知パラメータと見なし音声信号と同時に推定できるよう、信号とパラメータの同時確率密度関数に着目することによりベイズ定理の級数展開型表現を新たに導出した。骨導音と気導音の両者を逐次に同時観測することから互いの相関情報を反映した展開係数は膨大な数に及ぶため、計算に要する負荷を低減させるよう有効性の高い情報のみに着目し展開係数を計算するための新たな実用的アルゴリズを提案した。今後、研究開発した音声信号推定アルゴリズムに対する有効性を実験的に確認する予定である。
|
今後の研究の推進方策 |
工場等の生産の現場への応用が可能な音声認識システムを構築するためには、平成29年度に研究開発した骨導音および気導音の同時計測に基づく実用的ベイズフィルタを、実際の騒音下における音声データに適用し、その実際的有効性を確認する必要がある。級数展開型の音声信号推定アルゴリズムにおける展開係数を簡易的に計算できるアルゴリズムを開発したため、骨導音と気導音のより高次の相関情報を考慮することが可能になった。また、アルゴリズムの適用可能範囲についての検討を、実データをもとに詳細に行う。 現実の骨導音計測においては、高周波域における信号減衰の影響が無視できず、音声認識率のさらなる向上を目指し、骨導音伝播モデルにおいて、(高周波と結びつく)より高次の相関情報を考慮することにより、提案した音声信号抽出法(ベイズフィルタ)の適用可能性の拡大について検討を行う。開発した推定アルゴリズムは高次展開係数の算定が容易であるため、考慮した高次情報と推定精度の関係について詳細に検討を行う予定である。 さらに、開発・改良した音声信号抽出法を、再度、実際の現場へ適用し実用化への検討を行う。具体的には、音声認識が必要とされる両手作業・狭い場所・暗い場所などペーパー使用不可能な状況における作業記録・情報伝達において、作業の安全性や効率性に関連する、ユーザの明瞭度評価や了解度評価を行い実用化における問題点の解決を図る。
|
次年度使用額が生じた理由 |
平成29年度は、無響室および実際の住環境それぞれにおいて、女声信号および男声信号に対する骨導音、気導音データを計測し、周囲騒音の統計量を種々変化させ異なるSN比において、研究開発した騒音抑圧法を適用し、音声信号推定精度の関係を整理・分類した。さらに、骨導音と気導音の高次相関情報を反映した高次の展開係数を算定するための実用的アルゴリズムを導出した。開発したアルゴリズムの実験的検証においては、平成30年度に実施の予定である。本年度、新たに購入した備品としては計測に使用するノートパソコンのみであったため、次年度使用額が生じた。 平成30年度では、前年度に研究開発した騒音を抑制し音声信号を精度よく推定するための実用的ベイズフィルタの有効性を実験的に検証する。ベイズフィルタによる信号抽出法の有効性を実証するためには、実際の騒音環境下で抽出された骨導音および気導音に対し、音声抽出に関する実験を繰り返し行い、性能評価を行う必要がある。現場で実際の骨導音と気導音を収録するための小型のピックアップ・マイクロフォン等を購入の予定である。また、実験補助やデータ整理のための謝金が必要である。さらに、昨年度の研究成果を、国内外の学会で発表する予定であり、そのための旅費・参加費や投稿中の論文別刷り料金(掲載決定後)が必要となる。
|