Das Data Warehouse wandert in die Cloud

Provider-unabhängig

von - 02.07.2018
Anders als Redshift, BigQuery oder das Azure SQL Data Warehouse ist der Elastic Data Warehouse Service von Snowflake Computing nicht an einen bestimmten Provider gebunden, auch wenn er derzeit nur auf Amazon Web Services genutzt werden kann. „Wir werden unser Angebot demnächst auch auf anderen Cloud-Plattformen zur Verfügung stellen“, verspricht Snowflake-Manager Avanes. Im Unterschied zu klassischen Shared-Nothing-Architekturen, in denen jeder Knoten Rechen- und Speicherkapazität haben muss, trennt Snowflake beide Komponenten. „Das ist genau die Flexibilität, die ich bei einem Cloud-Service suche“, lobt Carsten Bange von BARC. Als Storage kann Snowflake Objektspeicher (Blob Storage) wie Amazon S3, Azure Blob Storage oder Google Cloud Storage nutzen. Die reine Datenhaltung wird dadurch laut Snowflake sehr preisgünstig. Rechenkapazität bucht der Anwender nur dann flexibel zu, wenn er sie tatsächlich benötigt.
Artin Avanes
Dr. Artin Avanes
Director Product Management bei Snowflake Computing
Foto: Snowflake Computing
„Für analytische Zwecke bleiben relatio­nale Datenbanken das Mittel der Wahl.“
Ebenfalls Provider-unabhängig funktioniert der Enterprise Data Hub von Cloudera, der nicht nur auf Amazon Web Services, Microsoft Azure und der Google Cloud Platform, sondern auch im eigenen Rechenzentrum betrieben werden kann. Cloudera unterstützt Objektspeicher wie S3 und kann Cluster komplett herunterfahren, ohne dass die Daten verloren gehen. Über den Platform-as-a-Service-Dienst Cloudera Altus können Anwender direkt im Selfservice Abfragen durchführen.

Cloud-Traditionalisten

Neben den cloud-nativen Angeboten gibt es eine Reihe von Lösungen der traditionellen Data-Warehouse-Anbieter, die sich zusätzlich oder alternativ zum Einsatz im eigenen Rechenzentrum auch in einer Cloud-Umgebung betreiben lassen. Unternehmen können so hybride Data-Warehouse-Umgebungen aufbauen, ein Szenario, das laut BARC-Analyst Bange viele Anwender bevorzugen: „Die komplette Mi­gration eines Data Warehouse in die Cloud sehen wir eher selten.“ Cloudera-Manager Grotz ist allerdings skeptisch, was die Umsetzung einer solchen Strategie betrifft: „Es ist sicher nicht unmöglich, bringt aber sehr viel zusätzliche Komplexität mit sich.“
Zu den Lösungen, die sowohl On-Premise wie in der Cloud verfügbar sind, gehört beispielsweise die Vertica Analytics Platform von HPE. Der Hersteller bietet sie auch auf AWS, Azure, der Google Cloud Platform und in VMware-Cloud-Umgebungen an. Das Db2 Warehouse on Cloud von IBM – bisher als „dashDB for Analytics“ vertrieben, ist ein gemanagter Service, der auf der IBM-Cloud-Plattform Bluemix, aber auch auf AWS und Azure betrieben werden kann. Der Database Exadata Cloud Service von Oracle wird lediglich über die herstellereigene Cloud angeboten. SAP BW/4HANA lässt sich auf AWS, Azure und der Google Cloud Platform installieren, allerdings muss der Kunde eine eigene Lizenz mitbringen.

Data-Warehouse-Lösungen aus der Cloud (Auswahl)

Hersteller / Produkt

Bereitstellung: AWS / Azure / GCP / On-Premise

Kosten

Amazon Web Services / Amazon Redshift

● / ○ / ○ / ○

ab 0,25 Dollar pro Stunde

Cloudera / Enterprise Data Hub

● / ● / ● / ●

auf Anfrage

Google / BigQuery

○ / ○ / ● / ○

Speicher: ab 0,01 Dollar pro GByte und Monat, Abfragen: ab 5 Dollar pro TByte 4)

HPE / Vertica Analytics Platform

● / ● / ● / ●

auf Anfrage

IBM / Db2 Warehouse on Cloud

● / ● / ○ / ●

ab 50 Dollar pro Monat

Microsoft / Azure SQL Data Warehouse

○ / ● / ○ / ○

ab 1,021 Euro pro Stunde

Oracle / Database Exadata Cloud Service

○ / ○ / ○ / ●

ab 61 Euro pro Stunde

SAP / BW/4HANA

● / ● / ● / ●

auf Anfrage

Snowflake / Elastic Data Warehouse Service

● / ○ / ○ / ○

Speicher: ab 23 Dollar pro Monat, Compute:
ab 2 Dollar pro Stunde

Teradata / Teradata Database

● / ● / ○ / ●

ab 5466 Dollar pro Monat

Verwandte Themen