• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2019 Fiscal Year Research-status Report

A "easy hearing" public address system with microphone network and high quality speech synthesis

Research Project

Project/Area Number 19K15146
Research InstitutionMuroran Institute of Technology

Principal Investigator

小林 洋介  室蘭工業大学, 大学院工学研究科, 助教 (10735103)

Project Period (FY) 2019-04-01 – 2022-03-31
Keywords屋外拡声 / 聴き取りにくさ / IoT / 音声合成
Outline of Annual Research Achievements

聴こえにくいこともある屋外拡声システムの品質評価センシングとそのセンシング結果に伴って音声処理を行うシステムの研究を行っている。
センシングシステムに関しては,これまでの研究成果も取り込んでマイクロホンアレイを用いたIoTセンサーを開発した。この学習には実地での拡声音声のデータも学習している。特に学習アルゴリズムと前処理について詳しく検討した。学習アルゴリズムには性能の良さではディープラーニングが良かったものの,計算コストが小さいスパースモデリングの手法も精度が出ることが明らかとなり,組み込むマシンの性能を考慮して採用することとした。実機の実環境での性能評価手法についても検討し,実際に屋外で録音した拡声音声を録音し,聴取実験結果と比較することが可能なように環境整備を行った。
加えて,音声分析合成システムworldを用いた話速変換やPix2Pixを用いた声質変換なども実装した。声質変換は学習音源数の最適化を行い,学習に必要な文章は単純に多ければ良いのではなく,学習パラメータとの組み合わせで最適値があることが明らかとなった。話速変換も我々が利用を想定する範囲において品質とパラメータのベストミックスがあることが実験的に明らかとなった。またこの実験を実際の屋外拡声を想定した電話帯域音声の復元に対して行い,限られた条件では帯域制限された音声よりも高音質になることが明らかとなった。今後は主観評価も行う。,

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

品質センシングシステムと音声合成システムともに取り掛かっており,基本的な実装とその評価を終えている。特に品質センシングシステムはリアルタイム動作できるデモ機のプロトタイプが完成した。

Strategy for Future Research Activity

2020年度は二つのシステムの実環境を想定した評価を行うとともに,システム間の連携に着手する。

Causes of Carryover

新型コロナウイルス の発生に伴う学会の中止に伴う旅費の未使用,参加国際会議の締め切り変更に伴う英文校閲費の翌年度への繰越,学内経費等で本研究に関する機材購入執行などがあった。2020年は国際会議参加があること,2019年度の検討でGPUワークステーション使用演算が増えたためその環境整備をおこなうため,適切な予算執行は可能である。

  • Research Products

    (13 results)

All 2020 2019

All Journal Article (2 results) (of which Peer Reviewed: 2 results,  Open Access: 1 results) Presentation (11 results) (of which Int'l Joint Research: 2 results)

  • [Journal Article] Listening difficulty estimation model using short-time objective intelligibility measure for outdoor public address systems2020

    • Author(s)
      Keita Noguchi, Yosuke Kobayashi, Jay Kishigami and Kiyohiro Kurisu
    • Journal Title

      Acoustical Science and Technology

      Volume: 41 Pages: 420-422

    • DOI

      ast.41.420

    • Peer Reviewed / Open Access
  • [Journal Article] Japanese speech intelligibility estimation and prediction using objective intelligibility indexes under noisy conditions2019

    • Author(s)
      Yosuke Kobayashi and Kazuhiro Kondo
    • Journal Title

      Applied Acoustics

      Volume: 156 Pages: 327-335

    • DOI

      j.apacoust.2019.07.034

    • Peer Reviewed
  • [Presentation] 原音予測モデルを利用した客観音声了解度指標の提案2020

    • Author(s)
      小林洋介, 近藤和弘
    • Organizer
      日本音響学会2020年春季研究発表会
  • [Presentation] pix2pix話者変換を用いた狭帯域音声の高域補間2020

    • Author(s)
      小林洋介, 山部匠, 野口啓太, 赤泊寛和
    • Organizer
      日本音響学会2020年春季研究発表会
  • [Presentation] 中間特徴量を用いた屋外拡声音評価システムの実装2020

    • Author(s)
      野口啓太, 小林洋介, 岸上順一
    • Organizer
      日本音響学会2020年春季研究発表会
  • [Presentation] Comparison of STOI-type Intermediate Feature for Listening Difficulty Rating Prediction Model2019

    • Author(s)
      Keita Noguch, Yosuke Kobayashi, Jay Kishigami and Kiyohiro Kurisu
    • Organizer
      The 8th IEEE Global Conference on Consumer Electronics
    • Int'l Joint Research
  • [Presentation] The 8th IEEE Global Conference on Consumer Electronics2019

    • Author(s)
      Hirokazu Akadomari, Yuhi Sato,and Yosuke Kobayashi
    • Organizer
      The 8th IEEE Global Conference on Consumer Electronics
    • Int'l Joint Research
  • [Presentation] 屋外拡声品質予測モデルの中間特徴量の検討2019

    • Author(s)
      野口啓太, 小林洋介, 岸上順一, 栗栖清浩
    • Organizer
      情報処理学会SIGMUS
  • [Presentation] STOI型客観了解度指標を用いた屋外拡声音の聴き取りにくさ予測モデルの評価2019

    • Author(s)
      野口啓太, 小林洋介, 岸上順一, 栗栖清浩
    • Organizer
      電子情報通信学会応用音響研究会
  • [Presentation] STOI型客観了解度指標を用いた主観評価予測モデルの詳細評価2019

    • Author(s)
      野口啓太, 小林洋介, 岸上順一, 栗栖清浩
    • Organizer
      日本音響学会2019年秋季研究発表会
  • [Presentation] Elastic Netを用いた屋外拡声音の聴き取りにくさ予測2019

    • Author(s)
      野口啓太, 小林洋介, 岸上順一, 栗栖清浩
    • Organizer
      令和元年度電気・情報関係学会北海道支部連合大会
  • [Presentation] 2段階声質変換システムにおける学習文章数の比較2019

    • Author(s)
      赤泊寛和, 佐藤裕飛, 小林洋介
    • Organizer
      令和元年度電気・情報関係学会北海道支部連合大会
  • [Presentation] pix2pix話者変換を用いた狭帯域音声の高域補間2019

    • Author(s)
      山部匠, 野口啓太, 赤泊寛和, 小林洋介
    • Organizer
      令和元年度電気・情報関係学会北海道支部連合大会

URL: 

Published: 2021-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi