Research Abstract |
歌声のメロディを表すFOは,歌唱者の歌唱様式(ビブラートやオーバーシュートのような歌唱者の技術や個性を表す成分)を特徴づける微分方程式に従って生成されると想定する.しかし,この微分方程式が実際どのような形をしているのかは未知であるので,観測されるFOから,微分方程式を明らかにする問題と位置づけ,歌唱者ごとの歌唱様式を予測・説明する2つのモデルを構築した.昨年度収録した声楽家,ポップス歌手,素人歌唱者からなる歌声データペースを利用して評価実験を行った. 1.歌唱様式が相平面上のアトラクタにより特徴付けられると考え,動的システムとしてFO軌跡を表現した.そして,この相平面のFO軌跡の同時確率分布が近似的に微分方程式を表現すると考え,この分布をGMMでモデル化しか.声楽家,ポップス歌手,素人歌唱者のアトラクタを比較すると,その形状が異なり,提案モデルが歌唱様式(歌唱者)の自動識別に応用可能であることを示した. 2.階段状の音高軌跡にビブラートなどの動的変動成分が複雑に重ね合わされた状態でFOが出力されると想定し,この入力関係を全極モデルで表現したFO制御モデルを提案した.そして,観測されるFOだけから,反復法によって,階段状の音高軌跡と全極モデルのパラメータを推定するアルゴリズムを提案した.評価実験では,モデルパラメータの推定性能と再合成されるFOを正確率の観点から評価した.最後に,歌唱者のFO動的変動成分を別の歌唱者の動的変動成分と取り換え,声質と音高を変化させることなく歌唱様式だけを自由に変換可能な歌声合成手法を提案した. [研究の意義,重要性] 演奏行動信号(当該研究は歌声のFO軌跡)に含まれる演奏者のスタイルや個性を特徴づける技術は確立されていない.これは,従来の検索技術や信号生成技術の高品質化,また個性に着目した様々な応用(例えば,歌唱力評価,歌唱様式の転写など)に対して重要な技術である.また人間の演奏行動を理解するためにも重要な研究領域であると考えられる.
|