Big-Data-Analysen - Das leisten Cloud-Services

Big Data bei Microsoft anderen Providern

von - 04.09.2015
Hans Wieser, Business Lead Data Platform, Microsoft Deutschland
Hans Wieser, Business Lead Data Platform, Microsoft Deutschland: „Viele Unternehmen sind immer noch der Meinung, sie könnten das Thema Big Data aussitzen.“
In der Microsoft-Cloud Azure gibt es ebenfalls diverse Big-Data-Analyse-Angebote. HDInsight etwa stellt einen Hadoop-Cluster zur Verfügung. Dieser soll sich ebenfalls in wenigen Minuten aufsetzen, bis in den Petabyte-Bereich skalieren und mit lokal installierten Hadoop-Instanzen verknüpfen lassen. Mit Machine Learning lassen sich erfahrungsbasierte Analysealgorithmen über einen Webservice definieren und ausführen, wie sie zum Beispiel zur Entwicklung von Vorhersagemodellen (Predictive Analytics) verwendet werden. Echtzeitanalysen kann der Anwender mit Stream Analytics durchführen und zur Datenerfassung mit Event Hubs kombinieren, einer Plattform, die Log-Daten schnell in großen Mengen aufzeichnen kann, wie sie etwa auf Webseiten, mobilen Endgeräten oder in Industrieanlagen anfallen. Microsoft bietet die Möglichkeit, die Services einen Monat lang kostenlos zu testen. Start-ups können Machine Learning sogar drei Jahre gratis nutzen. Unterstützung bei der Einrichtung bietet neben den zahlreichen Microsoft-Partnern auch die Virtual Academy des Anbieters.
Erst vor Kurzem hat Microsoft die Cortana Analytics Suite angekündigt, die im Herbst 2015 auf den Markt kommen soll. Sie verbindet die bestehenden Big-Data-Cloud-Angebote mit einer Perceptive Intelligence genannten Auswahl an Werkzeugen zur intelligenten Erfassung und Verarbeitung von Daten. Dazu zählen Microsofts Siri-Alternative Cortana sowie Tools zur Sprach- und Gesichtserkennung und zur Analyse von Texten oder Bildern.

Big-Data-Services anderer Provider

Big-Data-Services gibt es von zahlreichen weiteren Unternehmen und in verschiedenen Ausprägungen. Einige treten als Big-Data-Spezialist und Cloud-Provider in einem auf, andere nutzen die Infrastruktur von Amazon, Google, Microsoft oder anderen Plattformanbietern, um ihre Hadoop-Distributionen oder Analyse-Tools hosten zu lassen. Alles aus einer Hand offeriert beispielsweise IBM mit Spark as a Service auf seiner App-Development-Plattform Bluemix. InfoSphere BigInsights, dasDB, Hadoop und weitere Big-Data-Services sind dort ebenfalls verfügbar.
SAP bietet seine In-Memory-Datenbank HANA auch als Platform as a Service in der eigenen Cloud an, sie läuft aber auch in den Clouds von Amazon, IBM und HP. Aus HPs HP Helion Cloud sind auch Cassandra und andere Big-Data-Services zu beziehen.
Wie HP Helion basieren auch die Clouds von Mirantis und Red Hat auf der Open-Source-Infrastruktur OpenStack. Dort kümmert sich die Entwicklergemeinde in einem Projekt namens Sahara um die Integration von Hadoop als Service.

Fazit

Keine Frage: Cloud-Services senken die Einstiegshürde für Big Data erheblich. Nutzungsabhängige Tarife ohne Vertragsbindung oder Fixkosten halten die Investitionen in erste Big-Data-Projekte in überschaubaren Grenzen. Oft sind Teststellungen sogar gratis zu haben. Zahlreiche Cloud-Provider bieten vorgefertigte Pakete für die häufigsten Anwendungsszenarien, sodass die Installation für erfahrene Entwickler oft in wenigen Minuten erledigt ist.
Die Cloud löst allerdings nicht das Kernproblem von Big Data. Viele Unternehmen vergessen nämlich über der Begeisterung, endlich ihre Datenschätze heben und analysieren zu können, völlig, sich zu fragen, was genau sie eigentlich wissen wollen. Wer einfach nur Petabytes von Daten mit Abfragen bombardiert, wird am Ende mit Dutzenden von Korrelationen dastehen – und nicht klüger sein als zuvor. „Durch die reine Korrelation von Daten wird noch kein Kausalzusammenhang bestätigt“, erinnert Google-Manager Bussmann zu Recht an eine simple Wahrheit, die allzu oft ignoriert wird.

Weitere Infos

Verwandte Themen