2016 Fiscal Year Annual Research Report
Study on robust speech by component movement on time frequency plane and construction of speech database for researchers
Project/Area Number |
26330188
|
Research Institution | The University of Electro-Communications |
Principal Investigator |
高橋 弘太 電気通信大学, 大学院情報理工学研究科, 准教授 (10188005)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | 音声音響データベース / 話速変換 |
Outline of Annual Research Achievements |
本課題は2つの目標を設定して実施した。第一の目標は、音響信号の妨害音に対する耐性を高める方法を開発し、妨害があっても聴き取り易い音提示法を提案し、その提案法に基づきシステムを試作し効果を実証することであった。昨年度までの研究で、FPGAシステムにAD/DA変換器を付加したシステムをすでに構築してるが、本年度はこのシステム上で実現するアルゴリズムについて検討を加えた。 妨害音に耐性を持つ音を生成しようとすると、不自然感の増大を招くという問題があった。これに対処するため、時間周波数平面上で音エネルギーの成分移動を行う方法を新たに考案し、実験によってその効果を確かめた。この方法は、音声の成分を時間周波数平面上で一定時間継続する主要な成分と、それ以外の成分に分割して、前者の中で、混合音を聴取したときに不自然感をもたらすと判定された成分を、時間周波数平面上で成分移動させる手法である。成分移動すべきかの判定手法を検討し、成分移動が十分有効であることを示すことができた。この手法は単に騒音に耐性の高い拡声システムだけでなく、一般的な信号混合にも有効であるという見通しが得られ、今後の新しい研究目標の設定にもつながった。 本課題の第一の目標は、研究者用音声データベースの作成とその公開であった。本年度は、公開ページを編集し、必要なデータをより見つけやすくなるように改善した。また、利用状況についても調査した。2016年度後半において、2ヶ月で600程度のアクセスがあり、音声ファイルは、70本程度がダウンロードされていた。またデータベースを利用して聴覚心理実験の研究に利用したというメールを研究者からいただくことができ、広帯域でコンプレッサ処理など人工的な操作が施されていない音声データベースとして本データベースが貴重であるとの評価をいただいた。以上より、本データベースは有効に活用されていると判断している。
|
Research Products
(2 results)