• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2020 Fiscal Year Annual Research Report

Design of Robust Speech Recognition System and Development of its Energy Harvesting System

Research Project

Project/Area Number 18H03212
Research InstitutionChitose Institute of Science and Technology

Principal Investigator

宮永 喜一  公立千歳科学技術大学, 理工学部, 教授 (20166185)

Project Period (FY) 2018-04-01 – 2022-03-31
Keywords音声認識システム / 音声情報処理 / エナジーハーベスト / 低消費電力技術 / 雑音ロバスト / ディジタル信号処理 / ハードウェア・ソフトウェア協調設計 / 回路とシステム
Outline of Annual Research Achievements

本研究は、4年間において、2つの環境(劣悪音響環境、サステナビリティ環境)に対して有効な音声認識LSIシステムを設計・開発し、そのフィールド実験を実施することで、実用性の高い音声認識・対話システムの実現を目指している。研究計画の前半2年間では、劣悪条件下における新しい音声認識技術の設計・開発・実現を行った。新しい雑音ロバスト音声認識手法の開発と、同時に、低消費電力化のためのハードウエア・ソフトウエアの協調設計によるシステム設計を進めた。2020年度は、新型コロナウィルス感染症の影響で、当初予定していた、国外でのフィールド実験や国内における類似の研究に関する情報収集などの調査が難しく、一部は、2021年度に繰り越している。2020年度(繰り越しの2021年度研究成果を含む)において、以下の研究成果が得られた。
(1) 雑音に埋もれた音声の分析技術の性能評価:雑音低減を効果的に行うランニングスペクトルドメイン上での聴覚心理学上のフィルタ設計を行い、特に子供の音声に対して有効なフィルタを実現し、性能評価を行った。
(2) 劣悪条件下での音声認識の方式提案:高齢者及び子供の音声データベースに対する評価実験を行った。特に、認識精度上、問題のあった、劣悪雑音環境下におけるシステムの性能向上を目指し、聴覚心理学上のフィルタ設計を行った。評価実験は、限定的であり、継続して実験を行う予定である。
(3) 誤認識動作を抑制する音声棄却の方式提案:様々な環境下における、全体システムの性能評価と検証を継続している。
(4) エナジーハーベストシステム指向認識システムの設計:上記の方式を含む自動音声認識システムの低消費電力化を実現するため、ソフトウエア・ハードウエアの協調設計を行った。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

本研究計画の3年目となる2020年度は、研究計画全体において、後半の研究期間となる。研究期間後半での概要は、エネルギーハーベスト向けのシステム化を目的とした、低消費電力型システムの設計・開発とその消費電力評価を行い、2000フレーズなど、比較的多数の音声に対する高性能音声認識方式の開発と評価実験を行う予定であった。2020年度は、新型コロナウィルス感染症の影響で、当初予定していた、国外でのフィールド実験や国内における類似の研究に関する情報収集などの調査が難しく、一部は、次年度(2021年12月)まで繰り越している。2020年度(2021年12月までの成果も含む)では、以下の内容について調査・研究を行った。
(1) 雑音に埋もれた音声の分析技術の方式の性能評価:すでに提案している、雑音低減を効果的に行うランニングスペクトルドメイン上でのバンドパスフィルタを用いた、システム全体の性能評価を実施した。
(2) 劣悪条件下での音声認識の方式提案:前半2年間において、劣悪雑音環境条件下において、最適解を得られるような雑音抑制手法の提案を行った。2020年度は、認識精度上、問題のあった、雑音環境下における子供の音声に関して、雑音低減を効果的に行うため、聴覚心理学上のフィルタ設計を行い、最適なフィルタを実現した。評価実験は、限定的であり、2021年度以降も引き続き、実験を行う予定である。
(3) 誤認識動作を抑制する音声棄却の性能評価:すでに提案している、音声棄却方式の性能評価実験を継続実施した。
(4) エナジーハーベストシステム指向認識システムの設計と開発:上記の方式を含む自動音声認識システムを低消費電力化システムで実現するため、ソフトウエア・ハードウエアの協調設計を検討し、計算コストの高い部分のハードウエア化を行った。

Strategy for Future Research Activity

後半2年間では、エネルギーハーベスト向けのシステム化を目的とした、低消費電力システムの設計・開発とその消費電力評価を行い、2000フレーズなど、比較的多数の音声に対する高性能音声認識システムの実フィールド実験が目標となっている。特に、音声認識・対話のソウトウエア・ハードウエアの協調設計によるシステム開発が必要で、さらに多数の語彙を対象にした実フィールドによる音声認識の実証実験を実施する。最終年度である2021年度(新型コロナウィルス感染症のため、一部の研究は2022年度に繰り越す予定)では、設計・実現されたシステムの性能評価を、様々な環境下において実施し、その検証を行う予定。
(1) 雑音に埋もれた音声の分析技術の方式の性能評価:実フィールドによる性能評価実験を継続する。
(2) 劣悪条件下での音声認識の方式の性能評価:実フィールドによる性能評価実験を継続する。特に、多数の語彙に対する音声認識を可能とするため、連続音声認識で利用されているニューラルネットワークによる特徴認識方式も追加導入し、性能向上を目指す。
(3) 誤認識動作を抑制する音声棄却の性能評価:実フィールドによる性能評価実験を継続する。
(4) エナジーハーベストシステム指向認識システムの設計と開発:システム全体でのソフトウエア・ハードウエアの協調設計を行う。

  • Research Products

    (12 results)

All 2021 2020 Other

All Int'l Joint Research (2 results) Journal Article (7 results) (of which Int'l Joint Research: 5 results,  Peer Reviewed: 7 results,  Open Access: 2 results) Presentation (2 results) (of which Int'l Joint Research: 2 results,  Invited: 2 results) Remarks (1 results)

  • [Int'l Joint Research] KMUTT/Faculty of Engineering(タイ)

    • Country Name
      THAILAND
    • Counterpart Institution
      KMUTT/Faculty of Engineering
  • [Int'l Joint Research] Gadjah Mada University/Faculty of Engineering(インドネシア)

    • Country Name
      INDONESIA
    • Counterpart Institution
      Gadjah Mada University/Faculty of Engineering
  • [Journal Article] Agricultural Year-Round Planning Model for Market-oriented Farms2021

    • Author(s)
      Chaiwongsai J.、Boonthep N.、Miyanaga Y.、Cheosuwan T.、Innawong B.
    • Journal Title

      Proceedings of The 6th International Conf, DAMT and ECTI NCON

      Volume: 1 Pages: 18~21

    • DOI

      10.1109/ECTIDAMTNCON51128.2021.9425758

    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] Discrete Wavelet Denoising into MFCC for Noise Suppressive in Automatic Speech Recognition System2020

    • Author(s)
      Naing Hay、Gadjah Mada University、Hidayat Risanuri、Hartanto Rudy、Miyanaga Yoshikazu、Gadjah Mada University、Gadjah Mada University、Hokkaido University
    • Journal Title

      International Journal of Intelligent Engineering and Systems

      Volume: 13 Pages: 74~82

    • DOI

      10.22266/ijies2020.0430.08

    • Peer Reviewed / Open Access / Int'l Joint Research
  • [Journal Article] Robot Speech Recognition of Child Isolated Words2020

    • Author(s)
      Yoshikazu Miyanaga, Yu Tian, Hiroshi Tsutsui
    • Journal Title

      Proceedings of International STEM Education Conference, IEEE

      Volume: 1 Pages: DVD

    • Peer Reviewed
  • [Journal Article] A Front-End Technique for Automatic Noisy Speech Recognition2020

    • Author(s)
      Naing Hay Mar Soe、Hidayat Risanuri、Hartanto Rudy、Miyanaga Yoshikazu
    • Journal Title

      Proceedings of 2020 23rd Conference of the Oriental COCOSDA International Committee

      Volume: 1 Pages: 49~54

    • DOI

      10.1109/O-COCOSDA50338.2020.9295006

    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] WiFi Fingerprint Based Indoor Positioning Systems Using Estimated Reference Locations2020

    • Author(s)
      AUNG Myat Hsu、TSUTSUI Hiroshi、MIYANAGA Yoshikazu
    • Journal Title

      IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences

      Volume: E103.A Pages: 1483~1493

    • DOI

      10.1587/transfun.2020SMP0024

    • Peer Reviewed
  • [Journal Article] Using Double-Density Dual Tree Wavelet Transform into MFCC for Noisy Speech Recognition2020

    • Author(s)
      Soe Naing Hay Mar、Hidayat Risanuri、Hartanto Rudy、Miyanaga Yoshikazu
    • Journal Title

      Proceedings of 2020 12th International Conference on Information Technology and Electrical Engineering (ICITEE), IEEE

      Volume: 1 Pages: 302~306

    • DOI

      10.1109/ICITEE49829.2020.9271737

    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] Metamaterial-Inspired Quad-Band Notch Filter for LTE Band Receivers and WPT Applications2020

    • Author(s)
      Keshavarz R.、Miyanaga Y.、Yamamoto M.、Hikage T.、Shariati N.
    • Journal Title

      Proceedings of URSI GASS 2020

      Volume: 13 Pages: DVD

    • DOI

      10.23919/URSIGASS49373.2020.9232331

    • Peer Reviewed / Open Access / Int'l Joint Research
  • [Presentation] Psychoacoustic Masking Effect for Robust Speech Communication Robot2020

    • Author(s)
      Yoshikazu Miyanaga
    • Organizer
      the 7th IEEE International Conference on Consumer Electronics Taiwan 2020
    • Int'l Joint Research / Invited
  • [Presentation] Topic High-Quality Video Wireless Communication for Multi-Media IoT2020

    • Author(s)
      Yoshikazu Miyanaga
    • Organizer
      The 12th International Conference on Humanoid, Nanotechnology, Information Technology, Communication and Control, Environment and Management
    • Int'l Joint Research / Invited
  • [Remarks] 北海道大学 大学院情報科学研究院 メディアネットワーク部門 情報通信ネットワーク研究室

    • URL

      https://csw.ist.hokudai.ac.jp/

URL: 

Published: 2022-12-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi