Die richtigen Datenbanken für Big Data

Das Datendilemma eigenständiger Nischenlösungen

von - 15.02.2016
Ein Rechenzentrum gleicht heute in puncto Datenmanagement-Technologien meist einem Flickenteppich: Das Sammelsurium reicht von relationalen Datenbanken über eigenständige reine NoSQL-Nischenlösungen bis hin zu spezialisierten Erweiterungen.
NoSQL-Lösungen wie MongoDB und Hadoop stellen in so einem Umfeld ein potentes Werkzeug für unstrukturierte Daten dar. Sie sind aus High-Volume-Umgebungen mit neuen Arten von Daten wie Social Media und webbasierten Anwendungen hervorgegangen. Diese Lösungen tun sich beim Speichern großer Mengen unstrukturierter Daten hervor und spielen eine entscheidende Rolle für Big Data und Internet der Dinge.
Allerdings haben die meisten von ihnen sehr vereinfachte Funktionen, wenn es darum geht, mit den Daten tatsächlich etwas zu tun. Bei solchen Lösungen wird die eigentliche Datenverarbeitung in die Anwendung verschoben, sodass die Entwicklung von Applikationen sehr viel komplexer ausfällt. Zudem fehlt typischen NoSQL-Lösungen die Konformität mit den sogenannten ACID-Eigenschaften für verlässliche Verarbeitungsschritte: Unteilbarkeit, Konsistenz, Isolation, Dauerhaftigkeit. Deshalb gibt es bei ihnen keine absolute Garantie, dass Transaktionen in der Datenbank sicher verarbeitet werden. Um dennoch ACID-Konformität zu erreichen, muss in den Anwendungen immer wieder sehr komplexer Code geschrieben werden.
Auf der anderen Seite wurden relationale DBMS von Anfang an entwickelt, um die ACID-Eigenschaften stets zu erfüllen, sodass sie sehr zuverlässig und robust funktionieren und mit den in ihnen gespeicherten strukturierten Daten auf einer sehr detaillierten Ebene gearbeitet werden kann. Zudem ermöglicht der relationale Charakter des DBMS einen umfassenden Überblick über alle gespeicherten Daten und darüber, wie sie mit anderen Unternehmensdaten in Beziehung stehen.
Vorteil Open Source: Freie DBMS erfüllen mittlerweile die Anforderungen der Unternehmen – zu einem Bruchteil der Kosten.
Vorteil Open Source: Freie DBMS erfüllen mittlerweile die Anforderungen der Unternehmen – zu einem Bruchteil der Kosten.
(Quelle: Gartner, State of Open Source RDBMSs, 2015)
Hinzu kommt, dass viele IT-Abteilungen nicht nur unterschiedlichste Datenbanksysteme einsetzen, sondern vermehrt auch auf nicht Compliance-konforme Schatten-IT ausweichen, um die Menge und Vielfalt ihrer Daten zu verwalten. Ein umfassendes Datenmanagement wird so nicht nur immer zeit- und ressourcenaufwendiger, auch das Risiko von Datenverlusten steigt.

Gemeinsam sind sie stark

Ohne Zweifel werden NoSQL-Funktionen bestehen bleiben und in Zukunft sogar noch wichtiger werden, denn Big Data- und Webapplikationen verändern schon heute das Datenmanagement von Unternehmen. Jedoch fehlt NoSQL-only-Lösungen die erwähnte ACID-Konformität, die insbesondere für den sicheren Umgang mit geschäftskritischen Daten von entscheidender Bedeutung ist.
Auf der anderen Seite fehlt den relationalen Datenbanken mit ACID-Konformität oft die erforderliche Performance, um auch unstrukturierte Daten effizient zu verarbeiten. Da Datensicherheit aber nicht Gegenstand von Kompromissen sein darf, müssen relationale Datenbankmanagementsysteme heute in der Lage sein, ein Maximum unterschiedlichster Datentypen zu verarbeiten, und NoSQL-Lösungen müssen sowohl Sicherheits- als auch Compliance-Funktionen integrieren, um wettbewerbsfähig zu bleiben.
In den nächsten Jahren werden sich Unternehmen also bei der Auswahl ihres DBMS nicht von einer Entweder-oder-Entscheidung leiten lassen, sondern von einem netzwerkähnlichen Ansatz ausgehen, bei dem die verschiedenen Lösungen nahtlos miteinander in Verbindung stehen und ihre jeweiligen Stärken kombinieren, um gemeinsam das Unternehmens-DBMS zu schaffen, das für Big Data gewappnet ist.
Verwandte Themen