Continuously Similarity Search for Evolvingi Sets
Project/Area Number |
18K11311
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 60080:Database-related
|
Research Institution | The University of Electro-Communications |
Principal Investigator |
Koga HIsashi 電気通信大学, 大学院情報理工学研究科, 准教授 (40361836)
|
Project Period (FY) |
2018-04-01 – 2022-03-31
|
Project Status |
Completed (Fiscal Year 2021)
|
Budget Amount *help |
¥2,730,000 (Direct Cost: ¥2,100,000、Indirect Cost: ¥630,000)
Fiscal Year 2020: ¥520,000 (Direct Cost: ¥400,000、Indirect Cost: ¥120,000)
Fiscal Year 2019: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Fiscal Year 2018: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
|
Keywords | 類似検索 / 集合 / ストリームデータ / スライディングウィンドウ / 情報推薦 / データストリーム / テキスト集合 / 転置インデクス / 枝刈り / 枝刈りアルゴリズム / 2部グラフ / クラスタリング |
Outline of Final Research Achievements |
This research studied similarity search for data streams. In particular, we regard the latest data in a data stream as an evolving set whose elements can change dynamically. Then, we realized the similarity search for data streams by reducing the problem to the set similarity search. In particular, we developed several fast similarity search algorithms that measure the similarity between two data just enough to determine the search results, avoiding unnecessary similarity computations. It is also our research contribution that we formulated two similarity search problems for data streams.
|
Academic Significance and Societal Importance of the Research Achievements |
本研究で定式化した類似検索問題は情報推薦という現実的な応用を持つ。例えばSNSにおいては、ユーザUのストリームをUが投稿したテキスト群でモデル化できる。この時、ストリームのスライディングウインドウはユーザUが直近に投稿したテキスト集合となり、Uが最近興味を持った事象を色濃く反映している。従って、スライディングウィンドウが似たユーザを探すことで、最近の興味が似たユーザを発見できる。そして、類似ユーザが閲覧しているニュース記事をお薦めするといった情報推薦サービスも実現可能になる。
|
Report
(5 results)
Research Products
(12 results)
-
-
-
-
-
-
-
[Journal Article] Extended Min-Hash Focusing on Intersection Cardinality2018
Author(s)
Hisashi Koga, Satoshi Suzuki, Taiki Itabashi, Gibran Fuentes Pineda, Takahisa Toda
-
Journal Title
Springer LNCS, Proc. 19th International Conference on Intelligent Data Engineering and Automated Learning (IDEAL’2018)
Volume: 11314
Pages: 17-26
DOI
ISBN
9783030034924, 9783030034931
Related Report
Peer Reviewed
-
-
-
-
-