2019 Fiscal Year Research-status Report
A "easy hearing" public address system with microphone network and high quality speech synthesis
Project/Area Number |
19K15146
|
Research Institution | Muroran Institute of Technology |
Principal Investigator |
小林 洋介 室蘭工業大学, 大学院工学研究科, 助教 (10735103)
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Keywords | 屋外拡声 / 聴き取りにくさ / IoT / 音声合成 |
Outline of Annual Research Achievements |
聴こえにくいこともある屋外拡声システムの品質評価センシングとそのセンシング結果に伴って音声処理を行うシステムの研究を行っている。 センシングシステムに関しては,これまでの研究成果も取り込んでマイクロホンアレイを用いたIoTセンサーを開発した。この学習には実地での拡声音声のデータも学習している。特に学習アルゴリズムと前処理について詳しく検討した。学習アルゴリズムには性能の良さではディープラーニングが良かったものの,計算コストが小さいスパースモデリングの手法も精度が出ることが明らかとなり,組み込むマシンの性能を考慮して採用することとした。実機の実環境での性能評価手法についても検討し,実際に屋外で録音した拡声音声を録音し,聴取実験結果と比較することが可能なように環境整備を行った。 加えて,音声分析合成システムworldを用いた話速変換やPix2Pixを用いた声質変換なども実装した。声質変換は学習音源数の最適化を行い,学習に必要な文章は単純に多ければ良いのではなく,学習パラメータとの組み合わせで最適値があることが明らかとなった。話速変換も我々が利用を想定する範囲において品質とパラメータのベストミックスがあることが実験的に明らかとなった。またこの実験を実際の屋外拡声を想定した電話帯域音声の復元に対して行い,限られた条件では帯域制限された音声よりも高音質になることが明らかとなった。今後は主観評価も行う。,
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
品質センシングシステムと音声合成システムともに取り掛かっており,基本的な実装とその評価を終えている。特に品質センシングシステムはリアルタイム動作できるデモ機のプロトタイプが完成した。
|
Strategy for Future Research Activity |
2020年度は二つのシステムの実環境を想定した評価を行うとともに,システム間の連携に着手する。
|
Causes of Carryover |
新型コロナウイルス の発生に伴う学会の中止に伴う旅費の未使用,参加国際会議の締め切り変更に伴う英文校閲費の翌年度への繰越,学内経費等で本研究に関する機材購入執行などがあった。2020年は国際会議参加があること,2019年度の検討でGPUワークステーション使用演算が増えたためその環境整備をおこなうため,適切な予算執行は可能である。
|