本研究では記号と信号の相互最適化フレームワークの構築を目指している.当該年度に行ったことは大きく分けて以下の2点である.
(1)メロディーの生成モデルの構築:メロディーの生成モデルとして,n-gram 分布の階層的生成モデルである Pitman-Yor 言語モデルを用いた.これは音符レベルの生成モデルと旋律レベルの生成モデルを階層的に組み合わせたものである.これにより,旋律らしさが定義可能になり,教師なしの旋律分割とその言語モデルの獲得が可能になった.本研究では,記号と信号の相互最適化により適切な記号接地を目標としており,この解決として記号創発問題に取り組んでいる.記号創発とは,計算機自体が記号系を生み出す過程を作り出すことである.ここではメロディにおける記号創発問題に取り組み,教師なしの旋律分割が可能となった. (2) 相互最適化フレームワークの定式化:音楽において重要な3要素である,拍,リズム,旋律を対象として,当該年度までに行ってきた拍位置の調節,ドラムパターンの特徴量のハイパーパラメタの調節という問題と,当該年度に行ったメロディーの教師なし旋律分割という3つの問題に対して,共通の信号と記号の相互最適化フレームワークによって解釈し,定式化を行った.具体的には,信号から記号への分節という処理層と,記号から信号の分節への検証という2つの処理層が存在し,この2つの処理のサイクルを経ながらエントロピーを最小化していくことで最適な記号を得ることができるというフレームワークによって解釈を行った.これは,音楽情報処理のさらなる発展に留まらず,音声認識,自然言語処理,画像認識等の発展への貢献が期待される.時系列データの一つである音楽を対象として,コンピュータを用いて情報処理を行うことにより,その音楽自体の根底に迫ると同時に,人間の認知や知性を解明する手がかりとなった.
|