Project/Area Number |
15K12064
|
Research Category |
Grant-in-Aid for Challenging Exploratory Research
|
Allocation Type | Multi-year Fund |
Research Field |
Perceptual information processing
|
Research Institution | Nagoya University |
Principal Investigator |
Toda Tomoki 名古屋大学, 情報基盤センター, 教授 (90403328)
|
Co-Investigator(Kenkyū-buntansha) |
中村 哲 奈良先端科学技術大学院大学, データ駆動型サイエンス創造センター, 教授 (30263429)
サクリアニ サクティ 奈良先端科学技術大学院大学, 先端科学技術研究科, 特任准教授 (00395005)
Neubig Graham 奈良先端科学技術大学院大学, 先端科学技術研究科, 客員准教授 (70633428)
|
Project Period (FY) |
2015-04-01 – 2019-03-31
|
Project Status |
Completed (Fiscal Year 2018)
|
Budget Amount *help |
¥3,510,000 (Direct Cost: ¥2,700,000、Indirect Cost: ¥810,000)
Fiscal Year 2017: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Fiscal Year 2016: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2015: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
|
Keywords | 音声強調 / 雑音抑圧 / 音声変換 / 音声加工 / サイレント音声 / 音声等認識 / 音声合成 / 信号処理 / 統計処理 |
Outline of Final Research Achievements |
In this research project, towards the development of a telecommunication system capable of keeping privacy and avoiding annoying others under real environments, we studied silent speech telecommunication techniques robust against external noise. We developed silent speech enhancement techniques making it possible to enhance body-conducted speech under noisy conditions complementary using air-conducted speech as well, which are detected using both body- and air-conductive microphones. Moreover, we developed speech modification techniques to enhance speech intelligibility under noisy conditions. Consequently, we have significantly improved robustness of silent speech telecommunication against external noise in both speaker and listener sides.
|
Academic Significance and Societal Importance of the Research Achievements |
本研究成果により、古くから盛んに研究されている空気伝導音声に対する強調処理に加え、新たに体内伝導音声も併用することで、お互いの収録過程に起因する音響的特徴を相補的に有効利用できることが示された。これにより、空気・体内伝導音声情報処理といった新たな研究分野が見い出された。本研究課題で構築した技術は、携帯電話やスマートフォンなどを用いた通話において、秘匿性を保持した発話や、周囲に迷惑をかけない発話を可能とするものであり、より利便性の高い音声コミュニケーションの実現が期待される。
|