Die richtigen Datenbanken für Big Data
Den Knoten knüpfen für verschiedenste Datentypen
von com! professional - 15.02.2016
Die große Herausforderung ist damit die Integration von Datentypen aus verschiedensten Quellen an einem zentralen Knotenpunkt – erst dann lassen sie sich wirklich analysieren und verstehen sowie gemeinsam mit bestehenden Daten aus langjährigen Lösungen nutzen. Mit anderen Worten: Daten aus Hadoop-Clustern oder MongoDB-Implementierungen müssen mit relationalen Tabellen in Einklang gebracht werden, um das Gesamtbild zu sehen, aussagekräftige Momentaufnahmen zu erhalten und mit wirklich allen Daten im Unternehmen wertschöpfend und sicher arbeiten zu können.
Big-Data-Apps: Weil PostgreSQL Sprachen und Formate wie Javascript, Python, Ruby, node.js, JSON, Geospatial und XML unterstützt, lassen sich damit sehr einfach Apps schreiben.
(Quelle: EnterpriseDB)
Der JSON-Datentyp ist ein Beispiel für ein Objekt, das eine wichtige neue Funktion eingeführt hat. Der Datentyp wird von einem anderen Feature namens „Foreign Data Wrappers“ verwendet. Dieses ist zentral für die Fähigkeit, Daten aus anderen Datenbanken zu unterstützen – und markiert einen wichtigen Schritt auf dem Weg zum Datenbanknetzwerk.
Foreign Data Wrappers erlauben die Integration von Daten aus externen NoSQL-Implementierungen wie MongoDB, MySQL oder Hadoop-Clustern in Postgres-Tabellen. So lassen sich unstrukturierte Daten, die in NoSQL-Lösungen innerhalb des Datenbanknetzwerks gespeichert sind, in eine Umgebung ziehen, deren transaktionale Funktionen den nötigen Detailgrad haben und die vollständig ACID-konform ist, um die nötige Datenkonsistenz zu gewährleisten. Dies ermöglicht es, Postgres als Datenbank-Hub zu verwenden, sodass Nutzer SQL-Abfragen für externe Datenquellen lesen und schreiben können, als wären sie Teil der eigenen Postgres-Tabelle.
Mit JSON/JSONB werden unstrukturierte und semistrukturierte Implementierungen unterstützt, deren Datentypen erkannt und die Daten mit relationalen Tabellen kombiniert. Da dabei aus einer Postgres-Tabelle heraus gearbeitet wird, geschieht dies unter Einhaltung der ACID-Grundsätze relationaler Technologien sowie zentraler Regeln der Geschäftsabwicklung und der Logik. So lassen sich die Grenzen zwischen Datensilos innerhalb heterogener Datenbanklandschaften aufbrechen und Anwendern wird ein ganzheitlicher Einblick in ihre Daten gewährt.