SAHARA: Memory footprint reduction of cloud databases with automated table partitioning


Brendle, Michael ; Weber, Nick ; Vallyev, Mahammad ; May, Norman ; Schulze, Robert ; Böhm, Alexander ; Moerkotte, Guido ; Grossniklaus, Michael


[img] PDF
paper-7.pdf - Veröffentlichte Version

Download (1MB)

DOI: https://doi.org/10.5441/002/edbt.2022.02
Weitere URL: https://openproceedings.org/html/pages/2022_edbt.h...
URN: urn:nbn:de:bsz:180-madoc-623669
Dokumenttyp: Konferenzveröffentlichung
Erscheinungsjahr: 2022
Buchtitel: Proceedings of the 25th International Conference on Extending Database Technology, EDBT 2022. Edinburgh, UK, March 29 - April 1
Titel einer Zeitschrift oder einer Reihe: Advances in Database Technology
Band/Volume: 25,1
Seitenbereich: 13-26
Veranstaltungstitel: EDBT 2022
Veranstaltungsort: Edinburgh, UK
Veranstaltungsdatum: 29.03.-01.04.2022
Ort der Veröffentlichung: Konstanz
Verlag: OpenProceedings.org
ISBN: 978-3-89318-086-8
ISSN: 2367-2005
Verwandte URLs:
Sprache der Veröffentlichung: Englisch
Einrichtung: Fakultät für Wirtschaftsinformatik und Wirtschaftsmathematik > Practical Computer Science III (Moerkotte 1996-)
Bereits vorhandene Lizenz: Creative Commons Namensnennung, nicht kommerziell, keine Bearbeitung 4.0 International (CC BY-NC-ND 4.0)
Fachgebiet: 004 Informatik
Abstract: Enterprises increasingly move their databases into the cloud. As a result, database-as-a-service providers are challenged to meet the performance guarantees assured in service-level agreements (SLAs) while keeping hardware costs as low as possible. Being cost-effective is particularly crucial for cloud databases where the provisioned amount of DRAM dominates the hardware costs. A way to decrease the memory footprint is to leverage access skew in the workload by moving rarely accessed cold data to cheaper storage layers and retaining only frequently accessed hot data in main memory. In this paper, we present SAHARA, an advisor that proposes a table partitioning for column stores with minimal memory footprint while still adhering to all performance SLAs. SAHARA collects lightweight workload statistics, classifies data as hot and cold, and calculates optimal or near-optimal range partitioning layouts with low optimization time using a novel cost model. We integrated SAHARA into a commercial cloud database and show in our experiments for real-world and synthetic benchmarks a memory footprint reduction of 2.5× while still fulfilling all performance SLAs provided by the customer or advertised by the DBaaS provider.
Zusätzliche Informationen: Online-Ressource




Dieser Eintrag ist Teil der Universitätsbibliographie.

Das Dokument wird vom Publikationsserver der Universitätsbibliothek Mannheim bereitgestellt.




Metadaten-Export


Zitation


+ Suche Autoren in

+ Download-Statistik

Downloads im letzten Jahr

Detaillierte Angaben



Sie haben einen Fehler gefunden? Teilen Sie uns Ihren Korrekturwunsch bitte hier mit: E-Mail


Actions (login required)

Eintrag anzeigen Eintrag anzeigen