Ted Dunning von MapR

Neue Herausforderungen bei Big-Data-Projekten

von - 21.09.2018
Am PC coden
Foto: Christina Morillo / Pexels
Ted Dunning von MapR erklärt, wie sich Datensilos aufbrechen lassen, um eine vereinheitlichte und damit auch effizient nutzbare Datenhaltung zu schaffen.
Datenbanken, Dateien, Streams – Daten liegen in den unterschiedlichsten Formaten und auf den verschiedensten Plattformen vor. Der Software-Hersteller MapR ist angetreten, diese Silos aufzubrechen und die Datenhaltung zu vereinheitlichen. Wie das funktioniert und was Unternehmen davon haben, erklärt Ted Dunning, Chief Application Archi­tect bei MapR.
com! professional: Herr Dunning, MapR will mit seiner Converged Data Platform eine einheitliche Umgebung für das Datenmanagement bieten. Warum ist das so wichtig?
Ted Dunning: Das größte Problem für die Unternehmen ist nach wie vor, dass die Datenwelt in Paralleluniversen eingeteilt ist. In der einen Dimension haben wir die relationalen Datenbanksysteme, in der zweiten Dateien in Verzeichnissen und in der dritten Streaming-Ereignisse. Jedes Modell folgt eigenen Gesetzmäßigkeiten, benötigt unterschiedliche Kenntnisse zur Verwaltung und Analyse und hat seine Anforderungen an die Infrastruktur. Mit wachsenden Datenmengen wird die Verwaltung und Integration immer aufwendiger und komplexer.
Ted Dunning, MapR
Ted Dunning ist Chief Application Architect bei MapR
(Quelle: MapR)
Hinzu kommt, dass Big-Data-Systeme wie Apache Kafka oder Cassandra, die ja eigentlich für die Verarbeitung großer Datenmengen konzipiert sind, nur sehr bedingt skalieren. Das führt zum Aufbau vieler, wenn nicht sogar Hunderter Cluster – ein Albtraum für jeden Datenmanager.
com! professional: Verschärft die zunehmende Nutzung verteilter Cloud-Infrastrukturen das Problem?
Dunning: Das Entscheidende an Cloud-Computing ist, dass es die Erwartungshaltung der Anwender verändert hat. Rechenressourcen müssen heute einfach zu konsumieren sein. Dies lässt sich nur erreichen, wenn eine Datenplattform aus standardisierten, austauschbaren Komponenten besteht, die sich im eigenen Rechenzentrum genauso nutzen lassen wie bei Amazon, Microsoft oder Google.
com! professional: Ist das eine der Stärken von MapR?
Dunning: Ja, unsere Lösung läuft auf jedem Computer, in jedem Rechenzentrum und in jeder Cloud – oder einer beliebigen Kombination unterschiedlicher Ressourcen. Da wir MapR von vornherein als verteilte Infrastruktur konzipiert haben, ist die Plattformneutralität quasi eingebaut.
com! professional: Ist denn auch der Datenschutz eingebaut? Die Datenschutz-Grundverordnung verlangt etwa eine „Data Privacy by Design“?
Dunning: Das bieten wir nicht – und können es auch nicht. Wir stellen ja nur die Datenplattform zur Verfügung. Ob und wie die darin verwalteten personenbezogenen Daten geschützt oder ausgewertet werden, hängt letztlich davon ab, wie die Applikation damit umgeht. Was wir allerdings bieten, ist „Security by Design“. Alle Daten werden innerhalb der Plattform durchgängig verschlüsselt, sowohl bei der Übertragung als auch bei der Speicherung.
com! professional: Die Datenschutz-Grundverordnung enthält auch ein Recht auf Vergessen. Unterstützen Sie Anwender bei der Umsetzung von Löschanfragen?
Dunning: Ja. Sie können auf unserer Datenplattform jederzeit einzelne Bytes in einer Datei überschreiben, um beispielsweise die persönlichen Informationen eines Kunden zu entfernen. Für andere Systeme wie Hadoop oder S3 stellt das eine riesige Herausforderung dar. Einmal geschrieben, lassen sich Daten nicht verändern.
Verwandte Themen