Cloudbasierter Content Hub als Drehscheibe

Enterprise-NoSQL-Datenbank

von - 19.02.2019
Nach einer Evaluationsphase und der Erarbeitung eines Proofs of Concept hatte sich herausgestellt, dass für diese Aufgabe eine NoSQL-Datenbank, die auf einem flexiblen Datenmodell basiert, am besten geeignet ist. Denn in relationalen Datenbanken gestalten sich der Import und die Konvertierung von Dateien zeitaufwendig und komplex. Die Haufe Group entschied sich für ein NoSQL-Datenbanksystem von MarkLogic, dessen Betrieb cloudbasiert über Microsoft Azure laufen sollte.
In einem ersten Schritt wurde das Konzept des Content Hubs erstellt und danach ein grobes Datenmodell erarbeitet, das unterschied­liche Inhalte in ein einheitliches Format überführt. Ziel war es, die Automatisierung der häufig notwendigen Dokumentenaktualisierungen möglichst einfach zu gestalten und gleichzeitig die Suchergebnisse für Nutzer deutlich zu verbessern.
Alexander Bieber
Projektleiter Content Hub bei der Haufe Group
www.haufegroup.com
Foto: Bild: Haufe
„Unsere Redaktion arbeitete schon immer sehr Content-orientiert. Diese Arbeitsweise musste in die digitale Dokumentenverwaltung übertragen werden.“
Die schnelle und unkomplizierte Aktualisierung der Dokumente war für Haufe von zentraler Bedeutung, denn das Know-how des Unternehmens gründet auf einer sehr detaillierten und vielfältigen Content-Erstellung. „Unsere Redaktion arbeitete schon immer sehr Content-orientiert. Diese Arbeitsweise musste in die digitale Dokumentenverwaltung übertragen werden“, beschreibt Alexander Bieber, Projektleiter Content Hub bei der Haufe Group, die Aufgabenstellung.  
Das zentrale Element der geplanten Architektur war eine Services-Schicht, die durch ein API-Gateway an die Konsumenten exponiert wird. Im Detail handelt es sich um Dienste für den Ingest des Contents (Verarbeitung von Content in der Datenbank) und für die Suche und Analyse der Inhalte.
Als weiteres tragendes Element wurde die MarkLogic-Software definiert, die die Services-Schicht unterstützt und als Suchmaschine und zentrale Dokumentenablage (Repository) agiert. Für die MarkLogic-Datenbank als zentralen Content Hub sprach zum einen die native XML-Verwaltung, da die meisten Daten in diesem Format vorliegen, zum anderen das flexible, schemalose Datenmodell, das eine hohe Skalierbarkeit bietet.
Verwandte Themen