Das Data Warehouse wandert in die Cloud
Provider-unabhängig
von Thomas Hafen - 02.07.2018
Anders als Redshift, BigQuery oder das Azure SQL Data Warehouse ist der Elastic Data Warehouse Service von Snowflake Computing nicht an einen bestimmten Provider gebunden, auch wenn er derzeit nur auf Amazon Web Services genutzt werden kann. „Wir werden unser Angebot demnächst auch auf anderen Cloud-Plattformen zur Verfügung stellen“, verspricht Snowflake-Manager Avanes. Im Unterschied zu klassischen Shared-Nothing-Architekturen, in denen jeder Knoten Rechen- und Speicherkapazität haben muss, trennt Snowflake beide Komponenten. „Das ist genau die Flexibilität, die ich bei einem Cloud-Service suche“, lobt Carsten Bange von BARC. Als Storage kann Snowflake Objektspeicher (Blob Storage) wie Amazon S3, Azure Blob Storage oder Google Cloud Storage nutzen. Die reine Datenhaltung wird dadurch laut Snowflake sehr preisgünstig. Rechenkapazität bucht der Anwender nur dann flexibel zu, wenn er sie tatsächlich benötigt.
Ebenfalls Provider-unabhängig funktioniert der Enterprise Data Hub von Cloudera, der nicht nur auf Amazon Web Services, Microsoft Azure und der Google Cloud Platform, sondern auch im eigenen Rechenzentrum betrieben werden kann. Cloudera unterstützt Objektspeicher wie S3 und kann Cluster komplett herunterfahren, ohne dass die Daten verloren gehen. Über den Platform-as-a-Service-Dienst Cloudera Altus können Anwender direkt im Selfservice Abfragen durchführen.
Cloud-Traditionalisten
Neben den cloud-nativen Angeboten gibt es eine Reihe von Lösungen der traditionellen Data-Warehouse-Anbieter, die sich zusätzlich oder alternativ zum Einsatz im eigenen Rechenzentrum auch in einer Cloud-Umgebung betreiben lassen. Unternehmen können so hybride Data-Warehouse-Umgebungen aufbauen, ein Szenario, das laut BARC-Analyst Bange viele Anwender bevorzugen: „Die komplette Migration eines Data Warehouse in die Cloud sehen wir eher selten.“ Cloudera-Manager Grotz ist allerdings skeptisch, was die Umsetzung einer solchen Strategie betrifft: „Es ist sicher nicht unmöglich, bringt aber sehr viel zusätzliche Komplexität mit sich.“
Zu den Lösungen, die sowohl On-Premise wie in der Cloud verfügbar sind, gehört beispielsweise die Vertica Analytics Platform von HPE. Der Hersteller bietet sie auch auf AWS, Azure, der Google Cloud Platform und in VMware-Cloud-Umgebungen an. Das Db2 Warehouse on Cloud von IBM – bisher als „dashDB for Analytics“ vertrieben, ist ein gemanagter Service, der auf der IBM-Cloud-Plattform Bluemix, aber auch auf AWS und Azure betrieben werden kann. Der Database Exadata Cloud Service von Oracle wird lediglich über die herstellereigene Cloud angeboten. SAP BW/4HANA lässt sich auf AWS, Azure und der Google Cloud Platform installieren, allerdings muss der Kunde eine eigene Lizenz mitbringen.
Data-Warehouse-Lösungen aus der Cloud (Auswahl) |
||
Hersteller / Produkt |
Bereitstellung: AWS / Azure / GCP / On-Premise |
Kosten |
● / ○ / ○ / ○ |
ab 0,25 Dollar pro Stunde |
|
● / ● / ● / ● |
auf Anfrage |
|
○ / ○ / ● / ○ |
Speicher: ab 0,01 Dollar pro GByte und Monat, Abfragen: ab 5 Dollar pro TByte |
|
● / ● / ● / ● |
auf Anfrage |
|
● / ● / ○ / ● |
ab 50 Dollar pro Monat |
|
○ / ● / ○ / ○ |
ab 1,021 Euro pro Stunde |
|
○ / ○ / ○ / ● |
ab 61 Euro pro Stunde |
|
● / ● / ● / ● |
auf Anfrage |
|
● / ○ / ○ / ○ |
Speicher: ab 23 Dollar pro Monat, Compute: |
|
● / ● / ○ / ● |
ab 5466 Dollar pro Monat |