研究課題/領域番号 |
17300054
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
知覚情報処理・知能ロボティクス
|
研究機関 | 東京大学 |
研究代表者 |
嵯峨山 茂樹 東京大学, 大学院・情報理工学系研究科, 教授 (00303321)
|
研究分担者 |
小野 順貴 東京大学, 大学院・情報理工学系研究科, 講師 (80334259)
西本 卓也 東京大学, 大学院・情報理工学系研究科, 助教 (80283696)
金子 仁美 桐朋学園大学, 音楽学部, 講師 (00408949)
|
研究期間 (年度) |
2005 – 2007
|
研究課題ステータス |
完了 (2007年度)
|
配分額 *注記 |
16,750千円 (直接経費: 15,400千円、間接経費: 1,350千円)
2007年度: 5,850千円 (直接経費: 4,500千円、間接経費: 1,350千円)
2006年度: 4,600千円 (直接経費: 4,600千円)
2005年度: 6,300千円 (直接経費: 6,300千円)
|
キーワード | 音楽信号処理 / 音楽情報処理 / 多重音解析 / 楽音分離 / リズム認識 / 和声解析 / 音声認識 / 手書き文字認識 / 非負行列分解 / 調波成分分析 / 多重ピッチ推定 / 音楽スペクトル解析 / 手書き漢字・数式認識 / 調波・時間構造化クラスタリング / Specmurt法 / 自動伴奏 / 自動採譜 / 時間並行多重音信号 / 音楽解析 / 音楽認識 / 音楽生成 / 多重音 / 信号処理 |
研究概要 |
この研究は、主に多重音(和音など)や同時並行(伴奏など)を含む音楽信号と音楽情報を扱うために、多重音信号、多重音構造、時間並行構造を持つ対象の信号処理および情報処理の技術を、確率モデルに基づくアプローチにより新たに開拓し確立することを目的とした。典型的な応用分野としては、音楽の自動採譜、自動編曲、音楽情報検索、音楽の加工がある。調波・時間構造モデルに基づく多重音解析に関しては、調波構造と時間連接条件を満たす周波数時間平面上の混合ガウス分布で表現した音響オブジェクトモデルのパラメータ値を推定して複数ピッチを推定するHTC法を確立した。これに基づいて多重音を解析してMIDI情報へ変換する技術を開発した。リズムとテンポの推定に関しては、隠れマルコフモデルに基づいてリズムを認識し、隠れ変数としてテンポを推定して、MIDI情報から楽譜を復元する自動採譜技術や、既知の曲を任意のテンポで間違いながら弾くユーザに追従して伴奏を演奏する自動伴奏技術を開発した。異なる周期の複数信号の波形領域での分離に関して、異なる基本周期の複数波形の重畳から各音を分離する1チャネルブラインド音源分離技術を、EMアルゴリズムを拡張した補助関数法により解く技術を開発した。非負行列分解手法による多重音解析を開始し、観測スペクトログラムの時間周波数2次元行列をなるべく少数の基底ベクトル群の行列と音符活動行列の積に分解する手法において、結果ができるだけスパース(疎)になるように観測と分解の間の誤差の最小化問題を解くことで、音色ベクトル群と音符の活動区間を推定する技術を開発した。和声理論の体系化に関しては、HMMや確率的文脈自由文法により作曲法の基礎理論である和声学をコンピュータで扱える形に整理して「コンピュータ和声学」を確立する試みを行い、楽曲の自動和声解析、旋律への自動和声づけ、和声学に基づいた自動作曲などの基礎を作った。本研究は音声認識の手法を音楽情報処理へ応用することを特徴としており、開発した手法を音声認識や手書き文字認識にも応用した。
|