研究課題/領域番号 |
17K00253
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
研究分野 |
知覚情報処理
|
研究機関 | 名城大学 |
研究代表者 |
坂野 秀樹 名城大学, 理工学部, 准教授 (20335003)
|
研究期間 (年度) |
2017-04-01 – 2021-03-31
|
研究課題ステータス |
完了 (2020年度)
|
配分額 *注記 |
4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)
2020年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2019年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2018年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2017年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
|
キーワード | 3次元声道形状 / 声道断面積関数 / PARCOR分析 / フォルマント / FDTD法 / 機械学習 / ケリーの声道モデル / 声帯音源 / PARCOR係数 / ソースフィルタモデル / 音声分析合成 / 音声情報処理 |
研究成果の概要 |
音声信号から声道形状に相当するものを求める方法として、PARCOR係数から声道断面積関数を算出する方法がある。しかし、この声道断面積関数では、本来とは異なった形状が得られることがある上、複雑な形状は表現されない。これを踏まえ、本研究では音声信号から高精度に3次元声道形状を推定する方法について検討してきた。PARCOR係数から算出されるものは1次元の形状データに相当するため、まず3Dプリンタによってその声道模型を作成した上で、この声道模型を用いて音響特性を測定した結果と、形状データから音響特性を推定するFDTD法などによる結果との比較・分析を行った。そしてこの結果に基づき、提案法の改良を行った。
|
研究成果の学術的意義や社会的意義 |
音声信号から発声器官のパラメータを推定する研究や口唇の画像を生成する研究、3次元声道形状から音声を合成する研究は存在しているが、音声信号から3次元声道形状を推定し、さらにそれを用いて高品質に音声を合成する研究は世界的にも類を見ず、極めて独創的な研究である。今回の研究では、詳細な3次元声道形状を推定する部分の実現はできなかったが、今後、言語教育における発声の可視化への応用や、声質変換などの応用における新しい音声補間の方法の開発にもつながるなど、極めて意義深い研究であると考えている。
|