研究課題/領域番号 |
19K11979
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分60080:データベース関連
|
研究機関 | 大阪大学 |
研究代表者 |
肖 川 大阪大学, 情報科学研究科, 准教授 (10643900)
|
研究期間 (年度) |
2019-04-01 – 2022-03-31
|
研究課題ステータス |
完了 (2021年度)
|
配分額 *注記 |
3,640千円 (直接経費: 2,800千円、間接経費: 840千円)
2021年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2020年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2019年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
|
キーワード | クエリ処理 / ML for DB / 高次元データ / 類似検索 / query processing / ML + DB / high-dimensional data / similarity search / 問合せ処理 / 機械学習 / データベース / データサイエンス / ML+DB |
研究開始時の研究の概要 |
With the boom in the machine learning research area, a recent trend in database research is to apply machine learning techniques on challenging database tasks such as entity matching. Existing attempts are confronting the bottleneck of inadequate query processing speed for large-scale datasets and the difficulty in generalization across different applications. This project aims to address the fundamental problems of managing data with machine learning methods. The outcome of the research will have a strong impact by providing practical methods beyond what are currently available.
|
研究成果の概要 |
本研究では、機械学習に基づくデータマネジメントについてのクエリ処理を対象として、効率的なクエリ処理手法の開発に関する研究を行った。特に、埋め込みベクトルに対するクエリを効率的に処理するため、二つの解決策を開発した。1つ目は、2値の高次元ベクトルに対して、ハミング距離制約のある類似クエリを効率的に回答する。2つ目は、実数値の高次元ベクトルに対して、階層的なグラフ構造を用いて、近似最近傍探索を行う。また、機械学習の述語を含むクエリの処理を研究し、カーディナリティ推定により高速なクエリプランを生成する手法を開発した。システムのプロトタイピングと評価を行い、ソフトウェアのソースコードを公開した。
|
研究成果の学術的意義や社会的意義 |
本研究の成果は、機械学習に基づくデータマネジメントの実践的な手法を提供し、次世代データマネジメントシステムの開発に貢献する。最先端のデータベース技術を進展させ、機械学習、自然言語処理、コンピュータビジョンなどの関連研究分野やマーケティング、医療などの応用での技術開発に強い推進力を与える。また、日本のコンピュータサイエンスにおける威信を高め、海外の研究グループとのコラボレーションを促進することにも貢献する。
|