• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

音声の音源-調音分解を用いた自己教師あり表現学習

Research Project

Project/Area Number 24K02967
Research Category

Grant-in-Aid for Scientific Research (B)

Allocation TypeMulti-year Fund
Section一般
Review Section Basic Section 61010:Perceptual information processing-related
Research InstitutionNational Institute of Advanced Industrial Science and Technology

Principal Investigator

佐宗 晃  国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 研究チーム長 (50318169)

Co-Investigator(Kenkyū-buntansha) ATMAJA TrisBagus  国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 研究員 (70977032)
Project Period (FY) 2024-04-01 – 2027-03-31
Project Status Granted (Fiscal Year 2024)
Budget Amount *help
¥13,650,000 (Direct Cost: ¥10,500,000、Indirect Cost: ¥3,150,000)
Fiscal Year 2026: ¥4,550,000 (Direct Cost: ¥3,500,000、Indirect Cost: ¥1,050,000)
Fiscal Year 2025: ¥4,550,000 (Direct Cost: ¥3,500,000、Indirect Cost: ¥1,050,000)
Fiscal Year 2024: ¥4,550,000 (Direct Cost: ¥3,500,000、Indirect Cost: ¥1,050,000)
Keywords調音・音源分離 / 自己教師あり表現学習 / AR-HMM / SSL
Outline of Research at the Start

音声生成過程の古典的なモデルであるソース・フィルタモデルに従い、音声を声帯振動による音源と、声道による調音フィルタという互いに独立な物理的構成要素に分解する前処理の実施を考える。そして、それぞれの時系列に対して自己教師あり表現学習を適用すれば、音源と調音フィルタという物理的な意味合いが明確に区別できる構成要素毎に事前学習モデルが得られると共に、下流タスクに必要な情報を保持している特徴量の取捨選択も容易になると期待できる。

URL: 

Published: 2024-04-11   Modified: 2024-06-24  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi