研究課題/領域番号 |
17K00258
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
研究分野 |
知覚情報処理
|
研究機関 | 国立研究開発法人産業技術総合研究所 |
研究代表者 |
佐宗 晃 国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 研究グループ長 (50318169)
|
研究期間 (年度) |
2017-04-01 – 2020-03-31
|
研究課題ステータス |
完了 (2019年度)
|
配分額 *注記 |
4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)
2019年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2018年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2017年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
|
キーワード | 音声分析 / 食道発声音声 / 声質改善 / AR-HMM / 感情音声 / 音声情報処理 |
研究成果の概要 |
本研究課題では、声帯振動による周期的な音源で発声する健常者音声だけでなく、食道入り口部の振動による非定常・非周期的な音源で発声する食道発声音声のような特殊な音声を含む、より広範囲な音声を対象とする音声分析法の実現を目的として、音源を表すHMMの最適なトポロジをボトムアップに自動生成すると共に、そのモデルパラメータも同時推定し、声道特性と音源をより高精度に分離して抽出できる新しい音声分析法を構築した。そして、食道発声音声の声質劣化要因である音源を、喉頭全摘出前に収録した音声から推定した声帯音源などに入れ替えて再合成することで、もとの声質に近い発声を可能にする声質改善装置の実現可能性を検討した。
|
研究成果の学術的意義や社会的意義 |
音声は最も重要なコミュニケーション手段であり、高齢者のみならず人が充実した社会生活を送るために重要な要素である。しかし、喉頭がんの進行などにより喉頭全摘出手術を余儀なくされ、自分の声を失う高齢者は少なくない。本研究課題で実現を目指す声質改善装置は、不幸にして自分の声を失った人が、手術前の自分の声に近い発声を取り戻し、再度、自信をもって声による人とのコミュニケーションをとれるようにすることで、積極的な社会参加を促すことを目的とする。また、声帯音源で発声する健常者音声の分析手法は従来多く提案されているが、食道発声音声のような音声を対象としたものは決して多くない。
|