研究課題/領域番号 |
18K11376
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61010:知覚情報処理関連
|
研究機関 | 岡山大学 |
研究代表者 |
阿部 匡伸 岡山大学, ヘルスシステム統合科学学域, 教授 (70595470)
|
研究分担者 |
原 直 岡山大学, ヘルスシステム統合科学研究科, 助教 (50402467)
皆木 省吾 岡山大学, 医歯薬学総合研究科, 教授 (80190693)
|
研究期間 (年度) |
2018-04-01 – 2022-03-31
|
研究課題ステータス |
完了 (2021年度)
|
配分額 *注記 |
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2020年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2019年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2018年度: 2,600千円 (直接経費: 2,000千円、間接経費: 600千円)
|
キーワード | 声質変換 / 音声合成 / 舌亜全摘出者 / DNN / 知識蒸留 / 舌がん / 音韻明瞭性の改善 / 口唇情報 / 音韻明瞭せいの改善 / 音声明瞭性 / 深層学習 / 口唇形状 / 舌癌 / マルチモダル |
研究成果の概要 |
舌癌の治療で舌の一部を切除された患者(舌亜全摘出者)は,カ行,サ行,タ行の音韻を明瞭に発声できなくなり日常生活に支障を来す.本研究では音声信号処理によって,舌亜全摘出者が発声した音声を明瞭で聞き易い音声に変換する方式を検討した.提案方式はリアルタイム処理を実現するために差分スペクトル補正に基づく声質変換方式をベースとし,健常者音声と舌亜全摘出者音声との差分スペクトルをDeep Neural Networks(DNN)によって推定する.明瞭性の一層の向上を目指し,知識蒸留アプローチによる音韻情報の利用と,補助的な口唇形状の利用を提案し,評価実験により変換精度の改善を示した.
|
研究成果の学術的意義や社会的意義 |
音声はコミュニケーションの手段としてばかりでなく,人間としての尊厳を保ち豊かな生活を送るうえで重要な役割を果たしている.舌,顎,唇(以下,調音器官)の癌治療のために調音器官を切除して明瞭な音声を発声できなくなることは日常生活に測り知れない損失をもたらす.本研究では,癌治療によって舌を切除したために,音声を明瞭に発声できなくなった患者を対象に,患者が健常であった頃の音声を取り戻すための技術を提案し,その有効性を示した.2017年の国立がん研究センターの推計によれば,口腔・咽頭癌の患者数は約22,800人(癌患者の約2%を占める)であり,これらの患者が声を取り戻せる可能性を示した.
|