2012 Fiscal Year Research-status Report
音声特徴量の保存度に着目した建築空間における音声品質の実時間評価法の開発
Project/Area Number |
24760467
|
Research Category |
Grant-in-Aid for Young Scientists (B)
|
Research Institution | Kobe University |
Principal Investigator |
佐藤 逸人 神戸大学, 工学(系)研究科(研究院), 助教 (30346233)
|
Project Period (FY) |
2012-04-01 – 2015-03-31
|
Keywords | 残響音 / 騒音 / 「聴き取りにくさ」 |
Research Abstract |
本研究は,音声の物理的な特徴量の保存度に着目することにより,リアルタイムに室内空間における音声品質を評価する方法を開発することを目的とする。平成25年度は,基礎的な研究として,単一の反射音が存在する音場における入力音声信号と受音点における音声信号(出力音声信号)の音声特徴量の違いについて,詳細に検討した。 まず,音声信号から音声特徴量として一般に用いられるメルケプストラム係数(MFCC)とその時間的変動に着目したΔMFCCを,入力音声信号と出力音声信号についてそれぞれ算出し,それらのユークリッド距離を算出するプログラムを作成した。MFCCは音声の周波数特性の静的な特徴量であり,主に母音の物理的特徴を捉えるのに有効である。一方,ΔMFCCは音声の周波数特性の動的な特徴量であり,子音の物理的特徴を捉えるのに有効である。 次に,直接音と1つの反射音からなる音場を想定し,反射音の直接音に対する遅れ時間(Δt)と,直接音の音圧レベルを基準とした反射音の相対音圧レベル(ΔL)の2つをパラメータとして変化させた複数の音場における出力音声信号を作成し,これらの出力音声信号と入力音声信号のMFCC及びΔMFCCのユークリッド距離を算出した。その結果,Δtが長くなるほど,あるいはΔLが大きくなる(反射音の音圧レベルが高くなる)ほど,MFCC及びΔMFCCのユークリッド距離は長くなることを明らかにした。この傾向は,反射音の音声聴取に対する妨害の程度を示すパーセントディスターバンスと同じ傾向であることから,MFCC及びΔMFCCのユークリッド距離が反射音が存在する音場における音声品質評価に適用できる可能性があるといえる。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究は,残響音や騒音が存在する室内において,音声品質をリアルタイムで評価する方法を開発するものである。 平成24年度は,計算機上のシミュレーションで,室内音場のパラメータを変えた場合に受音点における音声の特徴量がどのように変わるか,そしてその特徴量の変化と既存の音声伝送品質の主観評価指標との対応を分析することが目的であった。この分析を行うためには,各種音声特徴量を算出し,さらに室内音場に入力する音声信号と受音点で測定される出力音声信号の音声特徴量の差を定量的に求めるプログラム開発が必要であった。このプログラムの開発は終了した。残響音や騒音の物理的特徴と音声特徴量の対応に関する分析については,残響音に関する基礎的な検討として,反射音が1つだけある場合について検討し,既存の主観評価指標であるパーセントディスターバンスと比較し,同様の傾向を示すことを明らかにした。音声特徴量を求めるプログラムの開発にやや手間取ったため,音声特徴量と室内音場のパラメータの対応の分析にやや遅れがあるが,計算機上のシミュレーションは比較的時間がかからないこと,および計画段階でもこの分析は平成25年度まで続行するとしているため,全体としては,おおむね順調に進展していると評価できる。
|
Strategy for Future Research Activity |
音声特徴量と室内音場のパラメータの対応に関する分析を,残響時間やSN比,あるいは既存の音声明瞭度と対応する物理指標などをパラメータとして用いて継続して進める。また,研究代表者らが提案し,有用性が評価されている音声品質の主観評価指標である「聴き取りにくさ」と音声特徴量の対応についても分析を進める。 また,音声特徴量及びそれに対応する音声品質の評価指標を,実際にリアルタイムで測定可能な測定システムの構築を開始する。システムの構築にはハードウェアだけでなく,ソフトウェアの開発が必要である。リアルタイムで音声品質の評価を表示する場合,時々刻々得られる評価をどの程度の時間窓で積分すればよいかを明らかにする必要があるため,心理実験を行い最適化を行う。
|
Expenditure Plans for the Next FY Research Funding |
測定システムの構築に必要な備品を購入する。最終的には発話者自身が測定用音源となるが,この時点では発話者の動きの影響を無くすため,ダミーヘッドマネキンを購入する必要がある。また,マイクホンや測定結果を解析するパソコン等のシステム構築に必要な備品も合わせて購入する。また,音声特徴量と音声品質の主観評価指標の対応に関する研究,およびリアルタイムで得られる評価を積分する時間窓の最適化に関する研究については,被験者実験を行う必要があるため,実験の被験者と資料整理担当の研究補助者に対する謝金が必要である。
|