2021 年度実績報告書

劣悪条件下音声認識方式の設計とそのエナジーハーベスト化システムの開発

研究課題

研究課題/領域番号	18H03212
研究機関	公立千歳科学技術大学
研究代表者	宮永喜一公立千歳科学技術大学, 理工学部, 教授 (20166185)
研究期間 (年度)	2018-04-01 – 2022-03-31
キーワード	音声認識システム / 音声情報処理 / エナジーハーベスト / 低消費電力技術 / 雑音ロバスト / ディジタル信号処理 / ハードウェア・ソフトウェア協調設計 / 回路とシステム
研究実績の概要	本研究では、4年間において、2つの環境（劣悪音響環境、サステナビリティ環境）に対して有効な音声認識LSIシステムを設計・開発し、そのフィールド実験を実施することで、実用性の高い音声認識・対話システムの実現を目指した。研究計画の前半2年間では、劣悪条件下における新しい音声認識技術の設計・開発・実現を行った。新しい雑音ロバスト音声認識手法の開発と、同時に、低消費電力化のためのハードウエア・ソフトウエアの協調設計によるシステム設計を進めた。後半の2年間(2020及び2021年度)は、新型コロナウィルス感染症の影響で、当初予定していた、国外でのフィールド実験や国内における類似の研究に関する情報収集などの調査が難しく、一部は、2022年度に繰り越している。2021年度（繰り越しの2022年度研究成果を含む)において、以下の研究成果が得られた。（1）雑音に埋もれた音声の分析技術の方式の性能評価：すでに提案している、雑音低減を効果的に行うランニングスペクトルドメイン上でのバンドパスフィルタを用いた、システム全体の性能評価を実施した。（2）劣悪条件下での音声認識の方式提案：前半2年間において、劣悪雑音環境条件下での、最適解を得られるような雑音抑制手法の提案を行った。2021年度は、認識精度上、問題のあった、雑音環境下における子供の音声に関して、雑音低減を効果的に行うため、聴覚心理学上のフィルタ設計を行い、最適なフィルタを実現した。（3）誤認識動作を抑制する音声棄却の性能評価：すでに提案している、音声棄却方式の性能評価実験を継続実施した。（4）エナジーハーベストシステム指向認識システムの設計と開発：上記の方式を含む自動音声認識システムを低消費電力化システムで実現するため、ソフトウエア・ハードウエアの協調設計を検討し、計算コストの高い部分のハードウエア化を行った。
現在までの達成度 (段落)	令和3年度が最終年度であるため、記入しない。
今後の研究の推進方策	令和3年度が最終年度であるため、記入しない。

研究成果
(7件)

すべて 2023 2021 その他

すべて国際共同研究 (1件) 雑誌論文 (3件) (うち国際共著 2件、査読あり 3件、オープンアクセス 1件) 学会発表 (2件) (うち国際学会 2件、招待講演 2件) 備考 (1件)

[国際共同研究] Chulalongkon Univeristy/Faculty of ENgineering(タイ)
- 国名
  タイ
- 外国機関名
  Chulalongkon Univeristy/Faculty of ENgineering
[雑誌論文] Efficient Dynamic Distributed Resource Slicing in 6G Multi-Access Edge Computing Networks with Online ADMM and Message Passing Graph Neural Networks2023
- 著者名/発表者名
  Asheralieva Alia、Niyato Dusit、Yoshikazu Miyanaga
- 雑誌名
  
  IEEE Transactions on Mobile Computing
  
  巻: 1 ページ: 1～18
- DOI
  10.1109/TMC.2023.3262514
- 査読あり / 国際共著
[雑誌論文] Learning-Based Rate Control for High Efficiency Video Coding2023
- 著者名/発表者名
  Chen Sovann、Aramvith Supavadee、Yoshikazu Miyanaga
- 雑誌名
  
  Sensors
  
  巻: 23 ページ: 3607～3607
- DOI
  10.3390/s23073607
- 査読あり / オープンアクセス / 国際共著
[雑誌論文] Scream Enhancement using Wave-U-Net2021
- 著者名/発表者名
  Riku Kasai, Noboru Hayasaka, Takuya Futagami, and Yoshikazu Miyanaga
- 雑誌名
  
  Proceedings of 2021 International Workshop on Smart Info-Media Systems in Asia (IEICE SISA)
  
  巻: 1 ページ: 5～8
- DOI
  10.34385/proc.66.SS1-2
- 査読あり
[学会発表] Psychoacoustic Techniques for Noise-Robust Speech Recognition2021
- 著者名/発表者名
  Yoshikazu Miyanaga
- 学会等名
  The 11th Conference on Speech Technology and Human-Computer Dialogue
- 国際学会 / 招待講演
[学会発表] Psychoacoustic Processing in DNN-HMM based Speech Recognition2021
- 著者名/発表者名
  Yoshikazu Miyanaga
- 学会等名
  2021 Regional Conference in EEE
- 国際学会 / 招待講演
[備考] 北海道大学大学院情報科学研究院メディアネットワーク部門情報通信ネットワーク研究室
- URL
  https://csw.ist.hokudai.ac.jp/

2021 年度 実績報告書

劣悪条件下音声認識方式の設計とそのエナジーハーベスト化システムの開発

研究代表者

宮永 喜一 公立千歳科学技術大学, 理工学部, 教授 (20166185)

研究成果

[国際共同研究] Chulalongkon Univeristy/Faculty of ENgineering(タイ)

国名

外国機関名

[雑誌論文] Efficient Dynamic Distributed Resource Slicing in 6G Multi-Access Edge Computing Networks with Online ADMM and Message Passing Graph Neural Networks2023

著者名/発表者名

雑誌名

DOI

[雑誌論文] Learning-Based Rate Control for High Efficiency Video Coding2023

著者名/発表者名

雑誌名

DOI

[雑誌論文] Scream Enhancement using Wave-U-Net2021

著者名/発表者名

雑誌名

DOI

[学会発表] Psychoacoustic Techniques for Noise-Robust Speech Recognition2021

著者名/発表者名

学会等名

[学会発表] Psychoacoustic Processing in DNN-HMM based Speech Recognition2021

著者名/発表者名

学会等名

[備考] 北海道大学 大学院情報科学研究院 メディアネットワーク部門 情報通信ネットワーク研究室

URL

2021 年度実績報告書

宮永喜一公立千歳科学技術大学, 理工学部, 教授 (20166185)

[備考] 北海道大学大学院情報科学研究院メディアネットワーク部門情報通信ネットワーク研究室