2019 Fiscal Year Annual Research Report
Real-Time Data Kernel for Data Intensive Science
Project/Area Number |
19H04117
|
Research Institution | Keio University |
Principal Investigator |
川島 英之 慶應義塾大学, 環境情報学部(藤沢), 准教授 (90407148)
|
Co-Investigator(Kenkyū-buntansha) |
松谷 宏紀 慶應義塾大学, 理工学部(矢上), 准教授 (70611135)
藤原 靖宏 日本電信電話株式会社NTTコミュニケーション科学基礎研究所, 上田特別研究室, 主任研究員 (70837971)
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Keywords | トランザクション / ロギング / 障害回復 |
Outline of Annual Research Achievements |
メニーコアマシンの性能を活用するためのインメモリDB高性能トランザクション技術として、Silo、Tictoc、Cicada, MOCCを始め、様々な手法が提案されている。これらの手法についてどのような方式をとれば優れた性能を発揮するのか自明ではなかった。そこで、7つの並行性制御法について7つの最適化手法を脱着可能であるベンチマークシステムCCBenchを設計・実装・評価した。当該システムを用いた実験の結果、2013年に提案された古典的手法Siloが多くの場合に優れた性能を発揮する一方、競合度の高い状況ではCicadaが優れた性能を発揮することが明らかになった。この研究成果に基づいて、データベースシステムにおける他の重要機構であるロギング・リカバリ機構についての検討を開始した。当該機構についてはストレージアクセスを必要とするために、不揮発メモリの活用方法が重要になると考えられる。そこでその研究を2020年度に実施することとした。これらのカーネル研究に加え、bマッチンググラフの高速化を行った。これは高次元データからグラフを計算するための便利なアプローチである。bmatchingグラフは、従来のk-NNグラフよりも効果的に高次元データをモデル化できる。ただし、bマッチンググラフの構築コストは、大規模なデータセットでは実用的ではない。これは、グラフ内のエッジを決定するために、収束するまでデータポイントのすべてのペア間でメッセージを繰り返し更新する必要があり、2次計画問題を対象としたソルバーを適用して各データポイントの非負のエッジの重みを計算するためである。そこでbマッチンググラフを効率的に作成できるb-dash法を提案した。 実験によると、結果の最適性を保証しながら、提案アプローチは以前のアプローチよりも最大58.6倍高速だった。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
不揮発メモリを利用可能な環境が準備できたため、それを用いたロギング法を提案、設計、実装、評価できた。
|
Strategy for Future Research Activity |
2020年度はこのカーネル基礎研究の成果を応用研究へ展開する方向を考えており、また、トランザクションの他要素であるロギングに関してSiloをベースとして技法を構築することを考えた。
|
Research Products
(4 results)