2020 Fiscal Year Research-status Report
多様な類似性解釈機構を備えた楽曲検索手法の開発~音響的類似性と言語的類似性の融合
Project/Area Number |
19K12282
|
Research Institution | Hokkaido University |
Principal Investigator |
大久保 好章 北海道大学, 情報科学研究院, 助教 (40271639)
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Keywords | 楽曲クラスタ / 楽曲形式概念 / 形式概念分析 / ラベル情報 / 音響情報 / 類似性 / τ-疑似クリーク |
Outline of Annual Research Achievements |
楽曲の多様な解釈・意味付け機構を備えたクラスタ分析エンジンを基礎とする楽曲類似検索手法の開発を目的とし,本年度は次の二点について研究を行った.
[楽曲形式概念] 外延(オブジェクト集合)と内包(共有離散属性集合)のペアとして定義される形式概念の枠組みを楽曲データに対して拡張し,高品質の楽曲クラスタの高速抽出アルゴリズムの設計・実装を行った.楽曲データは通常,ラベル情報と音響情報を有する.ラベル情報のみを用いて形式概念を抽出すると,得られるクラスタはラベルの共有を根拠とする類似楽曲から構成されるが,音響の観点では必ずしも類似していない.そこで,音響情報の類似性制約を内包に課すことで,ラベルと音響の両面において類似した楽曲から構成される外延を有する形式概念のみを抽出対象とし,これらを『楽曲形式概念』と定めた.音響類似性制約に基づく枝刈りを利用した高速な楽曲形式概念探索アルゴリズムを与え,The MagnaTagATune Dataset を用いた計算機実験により,得られる楽曲クラスタの品質が大きく改善されることを確認した.
[核を考慮した疑似クリーク] オブジェクトをノード,オブジェクト間の類似関係を辺で表現した無向グラフにおいて,密な部分グラフは類似オブジェクトのクラスタを与え,それらを列挙することで様々なクラスタを抽出することができる.密な部分グラフの理想はクリークであるが,クラスタが満たすべき条件としては過度な要請であり,疑似的なクリークを抽出対象とするアプローチが現実的である.ここでは,クリークの緩和モデルである 『τ-疑似クリーク』 を考え,τ-疑似クリークと形式概念の理論的な対応をもとに,形式概念分析に基づく高速抽出アルゴリズムを与えた.計算機実験により,提案アルゴリズムは数百万ノードのグラフに対しても十分高速に動作することを確認した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
今年度は二種類のクラスタ抽出エンジンについて設計と実装を終え,計算機実験によりそれらの動作を確認した.特に,楽曲の実データに対して行った計算機実験により,品質が十分改善された楽曲形式概念の抽出が可能であることを確認したことから,それらを基礎とする様々な応用へ向けての準備が整ったと考えている.
一方,τ-疑似クリークについては,楽曲実データに対する実験が未実施の状況であるが,その前段階として,極大クリークを楽曲クラスターと見做した場合の予備実験は既に終えている.そこで得られる楽曲クラスタ(極大クリーク)を構成する楽曲を実際に聴いたところ,多くのクラスタにおいて十分な類似性を感じることができ,満足できる品質のクラスタが得られることを確認している.τ-疑似クリークは核を共有する極大クリークの集まりであることから,極大クリーククラスタの品質をそのまま継承することが期待できる.その意味で,τ-疑似クリークに基づく楽曲クラスタについても,応用を考える上でその品質に関する大きな支障はないものと考えている.
以上より,楽曲クラスタに基づく類似楽曲検索の基礎は概ねまとまり,次年度(最終年度)はその応用タスクへの取り組みに注力できる.研究は概ね順調に進んでいると判断する.
|
Strategy for Future Research Activity |
次年度は,楽曲形式概念に基づくクラスタ,および,τ-疑似クリークに基づくクラスタに基づく類似楽曲検索の応用として,特に,プレイリストの自動生成タスクについて研究を進める.
楽曲クラスタは類似楽曲から構成されることから,最も素朴には,クラスタそのものをひとつのプレイリストと考えることもできるだろう.しかしその場合,プレイリストは極めて類似した曲ばかりとなり,退屈で面白みのないものとも言える.よってここでは,始点となるクエリ楽曲 Ms と,終点となるクエリ楽曲 Mg をユーザ入力とし,Ms から Mg へ至る楽曲系列をプレイリストとすることを考える.特に,隣接する楽曲同士が類似する系列を考えることで,必ずしも類似した楽曲ではない Ms と Mg を,類似楽曲の遷移によってスムーズにつなぐプレイリストの生成を試みる.具体的には,楽曲クラスタをノード,十分な重複を有するノード間に辺を作成した無向グラフを考え,Ms を含むノード(クラスタ)から,Mg を含むノードへの最短パスを求め,そのパスを構成する各クラスタから適当な楽曲を抜き出すことで類似楽曲よるスムーズな遷移を実現するものとする.提案手法の有効性は,得られたクラスタに対するユーザ評価をもとに行う.
|
Causes of Carryover |
新型コロナウィルスの感染拡大の影響により,国内・国外の会議参加,研究動向調査,および,研究連絡等がすべてオンラインで実施されたことに伴い,旅費の支出が一切発生しなかった.
未使用額は,最終年度の旅費の一部として,あるいは,研究設備の拡充のために執行する予定である.
|