2017 Fiscal Year Research-status Report
Large scale audio fingerprint searching in the internet using FPGA
Project/Area Number |
17K00074
|
Research Institution | Japan Advanced Institute of Science and Technology |
Principal Investigator |
井口 寧 北陸先端科学技術大学院大学, 情報社会基盤研究センター, 教授 (90293406)
|
Project Period (FY) |
2017-04-01 – 2021-03-31
|
Keywords | リコンフィギャラブルシステム / FPGA / GPGPU / 音楽電子指紋 / クラスタリング / MIDI / DWT |
Outline of Annual Research Achievements |
本研究では,インターネット上の音楽ファイルから電子指紋をリアルタイムに検出し,音楽情報DB(データベース)を検索しながら,電子ファイルの流通をコントロールするための要素技術を解明する.先立つ基盤研究(B)では,FPGA(Field Programmable Gate Array)を用いて電子指紋の超高速計算に取り組んだ.本研究では次の段階として,電子指紋のデータベース検索に取り組む.特に実用化のために必須な検索規模の拡大(数千万曲規模)に挑戦する. 検索大規模化の方針として,① FPGAを用いてハミング距離計算専用回路による高速照合を試みる.② 少ないFPGAチップ内メモリを利用するため,クラスタリングを用いた二段階検索を試みる.音楽電子指紋の実用規模検索の最適なソリューションを解明するのが本研究の目的である. 2017年度は Staged LSH法に基づくFPGA実装およびGPGPUでの実装を行った.それぞれ研究成果を査読付き国際会議に投稿し,採択された. 電子指紋は音楽の周波数遷移などの特徴をコンパクトに表現したビット列である.元の音楽ファイルが数MB以上であるのに対し,本研究で用いる電子指紋は4Kbit(512B)と十分コンパクトであるが,それでも数千万曲になると25GB程度となる.検索の度に25GB全部を照合することは不可能である. そこでFPGA向けのStaged-LSH法を提案し実装した.電子指紋を更にコンパクトな96bitのハッシュとし最初に粗い検索,次に指紋のハミング距離を正確に計算するという二段階の方式である.FPGAでの実装やGPGPUでの高速化の成果を国際会議にて発表した. この他に,このようなシステムをチップ上に効率良く収容するための相互結合網,音響シミュレーション,さらにはFPGA実装で得た知見をSnortに応用するなど幅広く研究を行い,成果を得た.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
予定されていた2017年度の研究実施項目は,FPGAによる電子指紋検索基盤の構築,評価基盤の確立である. 1.1) FPGAによる電子指紋検索システムの試作については,既にプロトタイプが完成し,国際会議で発表を行っている.加えてGPGPUによる検索など,更なる高速検索の方法を確立している.GPGPUによる検索では,一つ一つの検索速度はFPGAよりも低速だが,一度に多量の電子指紋を検索する場合には,複数の検索を同時実行できるメリットがあり,バッチ処理に向いていることが分かった.さらに複数のGPGPUを用いることによって,線形に処理性能が向上することが確かめられた.この成果も国際会議で採択・発表されている. 1.2) 音楽CDによる研究基盤の整備に関して,基本的なスキームが完成し,翌年度実施予定であるMIDIでの楽曲出力が得られている.規模の拡大については,今後取り組む予定である.
研究協力者のM. M. Hafizur Rahman (International Islamic University, Malaysia) 博士とは,将来のチップ化を見据えてハミング距離計算コアをNetwork on Chipで接続する時の構成を検討した.この成果は国際会議にて採択・発表された.
|
Strategy for Future Research Activity |
2018年度の研究実施項目として,クラスタリング法の改良と精度の検証や実システムの構築に取り組む予定である.第一に,周波数成分を用いたクラスタリング手法の開発・改良を行い.低周波成分と高周波成分の2段階によるクラスタリング法の開発する.研究計画ではFPGAへの実装を予定していたが,2017年度に得られた結果より,GPGPUの方がバッチでの高速化に適していると考えられるので,実装媒体をGPGPUとして先行して行う予定である. 2.2) MIDI音源による擬似楽曲の作成およびリッピングに関して,2017年度に基本的なスキームが考案されており,一部は実装も行われ動作が確認されている.この実行環境では一部人手が入るため,数千万楽曲を限られた時間で作成するのは現実的ではない.そこで2018年度は作成スキームを全て自動化することを考慮し,バッチで動作できるスクリプトとして議事音楽の作成を行う予定である.リッピングについては,楽曲のバランスを検討中である. 2017年度に副次的に取り組んだ音響シミュレーションについても,同じ16bit 44KHzの整数演算を多用するという問題の特性が非常に似通っているので,一部回路の共用などを通じて発展させる予定である.
|
Causes of Carryover |
物品費のうち,FPGA搭載サーバとFPGAボードの調達が行われなかった点が次年度使用額が発生した主な理由である.今年度実績で述べたように,2017年度研究の結果から,GPGPUによるバッチでの検索も相当な性能が見込めることが分かった.ここで見込みとしてFPGA搭載サーバを購入するよりも,もう少しGPGPUによる検索性能を見極め,必要であればFPGA搭載サーバの代わりにGPGPU搭載サーバに切り替えて研究を進めた方が,より適切な研究ができると判断した.
|
Research Products
(7 results)