• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2019 Fiscal Year Annual Research Report

An Implementation of Scalable and High Performance Multidimensional Data Store

Research Project

Project/Area Number 18H03242
Research InstitutionTokyo Institute of Technology

Principal Investigator

宮崎 純  東京工業大学, 情報理工学院, 教授 (40293394)

Co-Investigator(Kenkyū-buntansha) 波多野 賢治  同志社大学, 文化情報学部, 教授 (80314532)
中村 匡秀  神戸大学, システム情報学研究科, 准教授 (30324859)
Project Period (FY) 2018-04-01 – 2022-03-31
Keywords多次元データ / 集約演算 / 近似計算 / グラフ処理
Outline of Annual Research Achievements

本研究は、大規模多次元データの容易な維持管理ならびに利用が可能なシステムの実現を目的とする。関係データベース(RDB)とクラウドストレージ(NoSQL)の個々の実装に依存せずに各々の利点どうしを相補的に活用するために、個々のRDBやNoSQLを抽象化してミドルウェアで協調動作させ、スケーラブルな多次元データ基盤を実現する。これにより、大規模かつ多種多様、例えばグラフを含む多次元データに対しても、複雑な問い合わせ処理を可能にする。
本年度は、RDBとNoSQLの一般的なデータ操作APIを利用した多次元データストアにおける集約演算の近似問い合わせ処理手法について提案し、その評価を行った。提案した近似問い合わせ法は、KD-treeで分割された多次元データについて、各部分空間のデータを多次元ヒストグラムで近似化する手法、カーネル密度推定を利用して近似化する手法、ならびにこれら二つの手法を組み合わせた手法を提案した。多次元ヒストグラムは、データを近似化するとその要約データサイズを小さくできるものの、近似演算の精度は劣る。一方、カーネル密度推定による要約化では、データサイズは大きいが近似集約演算の精度は高い。多次元ヒストグラムとカーネル密度推定を組み合わせることにより、要約データを小さくしつつ集約演算結果の精度を高めることができる。これらの手法を、大規模センサーデータを利用した実験により評価し結果、多次元ヒストグラムとカーネル密度推定を組み合わせた手法は、多次元ヒストグラムに由来する要約データの小ささから応答時間が短く、同時にカーネル密度推定に由来して演算結果の精度が高く、時間と精度の両立が可能であることを示した。
これ以外にも、グラフデータに関する応用として、知識グラフを利用した、グラフ経路探索に基づく推薦アイテムの推薦理由生成に関する研究についても成果が得られた。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

本研究は、単一のシステムの内部に手を加えてスケーラブルにする方法とは異なり、ソフトウェア自体のメンテナンスのしやすさに利点がある。その半面、複数のシステムの利点・欠点の解析、ならびにAPIの抽象化に難しさがある。特に関係データベースはSQLという共通のデータ操作言語があるため問題とならないが、クラウドストレージは多様なインタフェースを持つ。
2018年度で実現したRDBとNoSQLを組み合わせた多次元データ基盤のアーキテクチャを踏襲し、その上で大規模なデータ処理で必須となる集約演算の近似演算を低コストでかつ高い精度で行うことのできる手法を提案し、良い結果が得られた。そのため、この研究項目については十分な達成度、完成度であると言え、今後も継続して研究を進めていく。
一方、グラフデータベースと関係データベースの統合も継続的に進めているが、多くの問題点が判明している。今後も継続してこの課題に望んでいく予定である。その過程で、グラフデータベースのアーキテクチャについて探求し、経路問い合わせとPageRankのような大域的なグラフ処理という全く性質の異なるグラフデータ処理を両立させる手法に関する新しい着想を得た。
多次元データ基盤の応用として、知識グラフを利用した情報推薦手法についても取り組んでおり、知識グラフの経路探索を行うことにより、推薦アイテムの推薦理由の生成や蓄積データが少ない時の、いわゆるコールドスタート問題の一助となる手法を提案している。多次元データ基盤の応用に関する研究項目については順調に進んでいると判断できる。

Strategy for Future Research Activity

今後も、関係データベースとNoSQLの統合に関して、近似集約演算のさらなる高精度化について研究を進める。また、グラフデータベースと関係データベースの統合方法について継続的に研究を進めるとともに、汎用グラフデータベース処理について研究を進める。
近似集約演算については、精度を高めるためのカーネル密度推定を応用する手法では、計算精度の保証が不可能である。計算精度を保証するための統計に基づく手法やビットスライスに基づく手法の検討を行うことにより、多次元データにおける精度が保証される近似集約演算について研究を行って行く予定である。
また、グラフデータベースについては、関係データベースとの組み合わせにより、時間とともにグラフ構造が変化するような動的なグラフ構造について、両者の機能を活用した効率の良いグラフデータベース処理について研究を進める。例えば、道路ネットワークにおいて、時間帯によって混雑の状況が変化するような場合を例に取り、その管理手法について検討を行う必要がある。また、グラフデータベースにおける経路探索や大域的なグラフ処理の本質的に異なる二つの処理を、単一のグラフデータベースで処理可能にするためのアーキテクチャやそのスケーラブルな処理手法について検討を行っていく予定である。
多次元データ基盤の応用として、引き続き知識グラフやオントロジなどのグラフ構造を利用した推薦システムなどの応用事例を検討し、それらの応用に必須となるグラフ処理の多次元データ基盤による支援について研究を進めていく。
今後これらの各研究項目の諸問題の解決方法を検討していき、研究の推進につなげる予定である。

  • Research Products

    (12 results)

All 2020 2019

All Journal Article (5 results) (of which Peer Reviewed: 5 results,  Open Access: 5 results) Presentation (7 results) (of which Int'l Joint Research: 1 results,  Invited: 1 results)

  • [Journal Article] A Model-Agnostic Recommendation Explanation System Based on Knowledge Graph2020

    • Author(s)
      Chen Yuhao、Miyazaki Jun
    • Journal Title

      Proc. of Database and Expert Systems Applications. DEXA 2020

      Volume: - Pages: 149~163

    • DOI

      10.1007/978-3-030-59051-2_10

    • Peer Reviewed / Open Access
  • [Journal Article] Accurate Aggregation Query-Result Estimation and Its Efficient Processing on Distributed Key-Value Store2019

    • Author(s)
      Yuki Kosuke、Keyaki Atsushi、Miyazaki Jun、Nakamura Masahide
    • Journal Title

      Proc. of Big Data Analytics and Knowledge Discovery. DaWaK 2019

      Volume: - Pages: 310~320

    • DOI

      10.1007/978-3-030-27520-4_22

    • Peer Reviewed / Open Access
  • [Journal Article] Recurrent Path Index for Efficient Graph Traversal2019

    • Author(s)
      Kusu Kazuma、Hatano Kenji
    • Journal Title

      Proc. of 2019 IEEE International Conference on Big Data (Big Data)

      Volume: - Pages: 6107~6109

    • DOI

      10.1109/BigData47090.2019.9006295

    • Peer Reviewed / Open Access
  • [Journal Article] Analyzing street crimes in Kobe city using PRISM2019

    • Author(s)
      Kagawa Takuhiro、Saiki Sachio、Nakamura Masahide
    • Journal Title

      International Journal of Web Information Systems

      Volume: 15 Pages: 183~200

    • DOI

      10.1108/IJWIS-04-2018-0032

    • Peer Reviewed / Open Access
  • [Journal Article] Implementation and Evaluation of Personal Ontology Building System with Virtual Agent2019

    • Author(s)
      Nakatani Shota、Saiki Sachio、Nakamura Masahide、Yasuda Kiyoshi
    • Journal Title

      Proc. of Digital Human Modeling and Applications in Health, Safety, Ergonomics and Risk Management. Healthcare Applications

      Volume: - Pages: 391~403

    • DOI

      10.1007/978-3-030-22219-2_30

    • Peer Reviewed / Open Access
  • [Presentation] 知識グラフを利用した協調フィルタリングにおけるユーザ間の類似度について2020

    • Author(s)
      岸嘉丸, 宮崎純
    • Organizer
      第12回データ工学と情報マネジメントに関するフォーラム(DEIM2020)
  • [Presentation] 未知スコア関数に対するTop-k検索アルゴリズムの提案2020

    • Author(s)
      池田達樹, 宮崎純
    • Organizer
      第11回ソーシャルコンピューティングシンポジウム
  • [Presentation] 部分グラフ検索高速化のためのハブ節点を考慮した関係辺の再帰走査法2020

    • Author(s)
      楠 和馬, 波多野 賢治
    • Organizer
      第12回データ工学と情報マネジメントに関するフォーラム(DEIM2020)
  • [Presentation] クエリログの部分的利用を考慮したグラフの集約演算高速化2020

    • Author(s)
      平方 俊行, 楠 和馬, 波多野 賢治
    • Organizer
      第12回データ工学と情報マネジメントに関するフォーラム(DEIM2020)
  • [Presentation] High Performance Data Processing for Big Data2019

    • Author(s)
      Jun Miyazaki
    • Organizer
      Korea-Japan (Japan-Korea) Database Workshop 2019
    • Int'l Joint Research / Invited
  • [Presentation] 知識グラフに基づくモデル独立型推薦解釈システム2019

    • Author(s)
      CHEN YUHAO, 宮崎純
    • Organizer
      電子情報通信学会データ工学研究会
  • [Presentation] ネイティブグラフデータベースにおける再帰的走査の効率化に向けた経路管理方法の提案2019

    • Author(s)
      楠 和馬, 波多野 賢治
    • Organizer
      情報処理学会データベースシステム研究会

URL: 

Published: 2021-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi