研究概要 |
この研究は,主に多重音(和音など)や同時並行(伴奏など)を含む音楽信号と音楽情報を扱うために,多重音信号,多重音構造,時間並行構造を持つ対象の信号処理および情報処理の技術を,確率モデルに基づくアプローチにより新たに開拓し確立することを目的とした。典型的な応用分野としては,音楽の自動採譜,自動編曲,音楽情報検索,音楽の加工がある。 研究代表者の嵯峨山は研究企画,信号処理および情報処理アルゴリズムを,研究分担者の小野は信号処理アルゴリズムとデータ解析,実証実験を,西本は情報処理アルゴリズムと対話型ツール開発を,金子は音楽データ収集,作編曲理論(和声学と対位法),自動編曲結果評価を分担した。本年度は特に以下の課題に取り組んだ。 1.調波,時間構造モデルに基づく多重音解析法(HTC法)による自動採譜 調波構造と時間連接条件を満たす周波数時間平面上の混合ガウス分布で表現した音響オブジェクトモデルのパラメータ値を推定して複数ピッチを推定するHTC法により音符のエネルギー分離を行い,単音モデルに基づいて各音開始時刻を推定し,隠れマルコフモデルによりリズムとテンポを推定することにより,楽譜を復元する技術を開発した。 2.異なる周期の複数信号の波形領域での分離 異なる基本周期の複数波形の重畳から各音を分離する手法を開発する。これは1チャネルのブラインド音源分離であり極めて困難な問題とされているが,EMアルゴリズムを拡張した新手法(「補助関数法」)により極値収束を避けて解く技術を開発した。 3.非負行列分解(Nonnegative Matrix Factorization)手法による多重音解析 音響信号中の同時並行音(多重音)を解析する手法として,観測スペクトログラムの時間周波数2次元行列を,なるべく少数の基底ベクトル群の行列と音符活動行列(非負)の積に分解する手法を検討した。結果ができるだけスパース(疎)になるように観測と分解の間の誤差の最小化問題を解くことで,音色ベクトル群と音符の活動区間を推定する技術を開発した。 4.文法理論による和声理論の体系化 確率的文脈自由文法により,作曲法の基礎理論である和声学をコンピュータで扱える形に整理,強化して,「コンピュータ和声学(仮称)」を確立して,楽曲の動和声解析,旋律への自動和声づけ,和声学に基づいた自動作曲などの基礎を作った。 5.本手法の他分野への応用 本研究は音声認識の手法を音楽情報処理へ応用することを特徴としており,開発した手法は音声認識や手書き文字認識にも応用できる。それらの研究も活発に行った。(成果リスト参照)。研究協力者Alain de Cheveigne(エコール,ノルマル,シューペリエー音楽,音声の認知の面からの共同研究を行った。
|