研究課題/領域番号 |
18H03212
|
研究機関 | 公立千歳科学技術大学 |
研究代表者 |
宮永 喜一 公立千歳科学技術大学, 理工学部, 教授 (20166185)
|
研究期間 (年度) |
2018-04-01 – 2022-03-31
|
キーワード | 音声認識システム / 音声情報処理 / エナジーハーベスト / 低消費電力技術 / 雑音ロバスト / ディジタル信号処理 / ハードウェア・ソフトウェア協調設計 / 回路とシステム |
研究実績の概要 |
本研究は、4年間において、2つの環境(劣悪音響環境、サステナビリティ環境)に対して有効な音声認識LSIシステムを設計・開発し、そのフィールド実験を実施することで、実用性の高い音声認識・対話システムの実現を目指している。研究計画の前半2年間では、劣悪条件下における新しい音声認識技術の設計・開発・実現を行った。新しい雑音ロバスト音声認識手法の開発と、同時に、低消費電力化のためのハードウエア・ソフトウエアの協調設計によるシステム設計を進めた。2020年度は、新型コロナウィルス感染症の影響で、当初予定していた、国外でのフィールド実験や国内における類似の研究に関する情報収集などの調査が難しく、一部は、2021年度に繰り越している。2020年度(繰り越しの2021年度研究成果を含む)において、以下の研究成果が得られた。 (1) 雑音に埋もれた音声の分析技術の性能評価:雑音低減を効果的に行うランニングスペクトルドメイン上での聴覚心理学上のフィルタ設計を行い、特に子供の音声に対して有効なフィルタを実現し、性能評価を行った。 (2) 劣悪条件下での音声認識の方式提案:高齢者及び子供の音声データベースに対する評価実験を行った。特に、認識精度上、問題のあった、劣悪雑音環境下におけるシステムの性能向上を目指し、聴覚心理学上のフィルタ設計を行った。評価実験は、限定的であり、継続して実験を行う予定である。 (3) 誤認識動作を抑制する音声棄却の方式提案:様々な環境下における、全体システムの性能評価と検証を継続している。 (4) エナジーハーベストシステム指向認識システムの設計:上記の方式を含む自動音声認識システムの低消費電力化を実現するため、ソフトウエア・ハードウエアの協調設計を行った。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究計画の3年目となる2020年度は、研究計画全体において、後半の研究期間となる。研究期間後半での概要は、エネルギーハーベスト向けのシステム化を目的とした、低消費電力型システムの設計・開発とその消費電力評価を行い、2000フレーズなど、比較的多数の音声に対する高性能音声認識方式の開発と評価実験を行う予定であった。2020年度は、新型コロナウィルス感染症の影響で、当初予定していた、国外でのフィールド実験や国内における類似の研究に関する情報収集などの調査が難しく、一部は、次年度(2021年12月)まで繰り越している。2020年度(2021年12月までの成果も含む)では、以下の内容について調査・研究を行った。 (1) 雑音に埋もれた音声の分析技術の方式の性能評価:すでに提案している、雑音低減を効果的に行うランニングスペクトルドメイン上でのバンドパスフィルタを用いた、システム全体の性能評価を実施した。 (2) 劣悪条件下での音声認識の方式提案:前半2年間において、劣悪雑音環境条件下において、最適解を得られるような雑音抑制手法の提案を行った。2020年度は、認識精度上、問題のあった、雑音環境下における子供の音声に関して、雑音低減を効果的に行うため、聴覚心理学上のフィルタ設計を行い、最適なフィルタを実現した。評価実験は、限定的であり、2021年度以降も引き続き、実験を行う予定である。 (3) 誤認識動作を抑制する音声棄却の性能評価:すでに提案している、音声棄却方式の性能評価実験を継続実施した。 (4) エナジーハーベストシステム指向認識システムの設計と開発:上記の方式を含む自動音声認識システムを低消費電力化システムで実現するため、ソフトウエア・ハードウエアの協調設計を検討し、計算コストの高い部分のハードウエア化を行った。
|
今後の研究の推進方策 |
後半2年間では、エネルギーハーベスト向けのシステム化を目的とした、低消費電力システムの設計・開発とその消費電力評価を行い、2000フレーズなど、比較的多数の音声に対する高性能音声認識システムの実フィールド実験が目標となっている。特に、音声認識・対話のソウトウエア・ハードウエアの協調設計によるシステム開発が必要で、さらに多数の語彙を対象にした実フィールドによる音声認識の実証実験を実施する。最終年度である2021年度(新型コロナウィルス感染症のため、一部の研究は2022年度に繰り越す予定)では、設計・実現されたシステムの性能評価を、様々な環境下において実施し、その検証を行う予定。 (1) 雑音に埋もれた音声の分析技術の方式の性能評価:実フィールドによる性能評価実験を継続する。 (2) 劣悪条件下での音声認識の方式の性能評価:実フィールドによる性能評価実験を継続する。特に、多数の語彙に対する音声認識を可能とするため、連続音声認識で利用されているニューラルネットワークによる特徴認識方式も追加導入し、性能向上を目指す。 (3) 誤認識動作を抑制する音声棄却の性能評価:実フィールドによる性能評価実験を継続する。 (4) エナジーハーベストシステム指向認識システムの設計と開発:システム全体でのソフトウエア・ハードウエアの協調設計を行う。
|