2017 Fiscal Year Research-status Report
縮小写像での積算型下限値によるクラスタリング法の高速化
Project/Area Number |
17K00159
|
Research Institution | University of Shizuoka |
Principal Investigator |
池田 哲夫 静岡県立大学, 経営情報学部, 教授 (60363727)
|
Co-Investigator(Kenkyū-buntansha) |
斉藤 和巳 静岡県立大学, 経営情報学部, 教授 (80379544)
青山 一生 日本電信電話株式会社NTTコミュニケーション科学基礎研究所, その他部局等, 主任研究員 (80447028)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | 情報検索 / クラスタリング / 可視化 / 縮小写像 |
Outline of Annual Research Achievements |
マルチメディアデータのクラスタリング技術の関連技術である類似検索技術の研究を先ず行った。類似検索では、一般にオフラインでの索引生成とオンラインでの類似検索の双方が高性能なことが要求される。この要求に応えるため、索引生成とオンライン類似検索の新技術を提案した。前者は、ピボット生成関数と、ピボットを用いて各ノードでのオブジェクト集合をほぼ同じサイズの部分集合に分割する関数とを再帰的に実行して、CBT(完全2分木)索引を生成する。後者は、このCBT索引を用いて、効率的に不必要な枝を枝刈りしオブジェクトをフィルタリングする。大規模画像データを用いた実験では、CBT索引は妥当な計算量で生成でき、類似検索の性能は代表的手法のM-indexよりも優れていることを確認した。 次いで、類似検索を高速化するための新たなピボット生成法を提案した。提案法は、①オブジェクト集合を再帰的に同一サイズの二つの部分集合に分割し、結果的に完全2分木を生成する階層的オブジェクト集合分割法と、②少ない計算量での目的関数計算を特徴とする高速ピボット最適化技法、とを用いてピボットを生成する。提案法は、クエリとオブジェクト間の距離のタイトな下限を提供するという性質を持ち、類似検索での不必要な距離計算を効率的に回避できる。 さらに、基本となるユークリッド空間のk-means法の枠組みで、縮小写像での積算型下限値となる射影フィルタに基づくクラスタリング高速化法を構築するとともに、その基本的な理論基盤を確立した。大規模画像データを用いた実験では、k-meansクラスタリングの最先端手法の Drake 法や Ding 法と比べて、クラスタ数 k が大きい状況で提案法を適用すれば、少ない主メモリ消費量で、高速に完全に一致したクラスタリング結果が求まることを確認した。本研究成果は、英文論文誌に投稿し本報告時点で査読中である
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究計画の根本的な問題意識は、大規模・高次元マルチメディアデータの効率的なクラスタリング技法の確立である。当初計画通り、基本となるユークリッド空間のk-means法の枠組みで、縮小写像での積算型下限値となる射影フィルタ (PRJ: projection-based filter)に基づくクラスタリング高速化法を構築するとともに、その基本的な理論基盤を確立した。さらに、マルチメディアデータのクラスタリングと密接に関連する類似検索において、索引生成とオンライン類似検索の新技術を提案した。 クラスタリング技法と類似検索技法は、共に距離計算の効率化が重要であり、共通する要素技術の多い、密接に関連する技法として知られている。クラスタリング技法、類似検索技法のそれぞれで得られた知見が他の技法の効率化に役立った例は多くみられる。 クラスタリング技術に関しては投稿中論文が1本であるものの、類似探索技術に関する研究成果2本が査読付き論文誌に採録されたことから、質的に「ほぼ計画通り」と考えても問題ないと判断する。
|
Strategy for Future Research Activity |
これまでに考案した技術の高度化と、これら技術の有効性の実証評価を引き続き進める。すなわち、当初計画通り、重点研究項目は以下に示す技術の確立や評価となる。 1: 多様なメトリック空間を対象とした積算型縮小写像技術の構築とその性能評価 2: 縮小写像混合方式によるクラスタリング構造化技術の構築とその性能評価 3: クラスタ構造分析のためのアノテーション付き可視化技術の構築とその性能評価
|
Causes of Carryover |
静岡県立大学において次年度使用が生じた理由は、国際会議に1件投稿する予定だったのが間に合わなかったためであり、次年度に国際会議の投稿費、出張費に使用予定である。 NTTの研究分担者において次年度使用が発生した理由は、購入した物品が予想価格よりも安価に購入できたためであり、次年度に周辺機器・書籍等の購入に使用予定である。
|
Research Products
(3 results)