2019 Fiscal Year Annual Research Report
Hyper mixer manipulating time-frequency plane and construction of sound source database for researchers
Project/Area Number |
17K00229
|
Research Institution | The University of Electro-Communications |
Principal Investigator |
高橋 弘太 電気通信大学, 大学院情報理工学研究科, 准教授 (10188005)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | 音声データベース / 時間周波数平面 |
Outline of Annual Research Achievements |
業務用の音響信号処理現場で応用可能であるだけでなく,より広範囲の人々の役に立つシステム,例えば高齢者や外国人にとっても聴き取り易い音響システムの実現に役立つ実時間音響信号処理系を実現するための知見を得ることと,システム実装を通して問題点を検証することを目的に本研究に取り組んでいる,この目的を達成するためにはFPGAによる専用処理系を構築する必要があり,また研究対象としては音源データベースが必要である.以上の目的意識の元,システムとデータベースの両者を構築しつつ研究を進めたのでそれぞれについて説明する. 前年度までにFPGA処理の構成要素であるIP(intellectual property core)についてはほぼ整ったので,パラメータを制御するためのプロセッサに対するソフトウエア開発を主に行ない全体としての完成度を上げた.また,前年度までは周波数軸上の音響信号の成分移動だけを扱っていたが,本年度は時間軸上での音響信号の成分移動についても研究に取り組んだ.具体的には複数の仮説に基づいて最適と思われる成分移動を行ったソースを作成し,それを被験者に試聴させる実験を行った.実験の結果,時間軸上での成分移動については,特に子音などで聞き取り易さを向上させる効果があることがわかった.一方,濁音など,効果の有意差を見いだせない音素もあった.これらの実験結果を元に,音素の種類を判定して効果的な成分移動を行うことが望ましいとの結論を得ることができた.一方,音源データベースについては,一文字違い音声の公開データについて,上であげた実証実験をもとに有用性の検証を行い,最後の整備を行った.音声と音楽を混合したサンプルも置くことによって,本データベースは,音声の研究のみならず 音声と音楽の混合に関しての聞き取り易さの研究にも利用することができると考えている.
|