Haufe Group

Cloudbasierter Content Hub als Drehscheibe

von - 19.02.2019
Cloud-Datenbank
Foto: Virgiliu Obada / Shutterstock.com
Eine moderne Datenbanktechnologie sorgt bei der Haufe Group für bessere Suchergebnisse. Dabei setzt das Unternehmen auf eine Cloud-gestützte Lösung.
Die Haufe Group hat sich aus den Kern­bereichen eines erfolgreichen Verlagsgeschäfts zu einem Spezialisten für digitale und webbasierte Services entwickelt und vertreibt heute vorwiegend digitale Produkte und Dienstleistungen. Lizenznehmer erhalten über kostenpflichtige Portale Zugriff auf Fachinformationen aus verschiedenen (Arbeits-)Bereichen wie zum Beispiel Personal, Steuern, Recht, Arbeitsschutz, Öffentlicher Dienst oder Compliance. Außerdem betreibt die Haufe Group eine Akademie mit einem breit gefächerten Seminarangebot für Fach- und Führungskräfte.
Die Fachexpertise des Unternehmens stützt sich auf riesige Datenmengen, die geschickt verwaltet und verknüpft werden müssen, damit sich Nutzer bei ihrer Online-Suche innerhalb kürzester Zeit einen möglichst umfassenden Überblick über das Angebot an Fachliteratur und Weiterbildungsangeboten verschaffen können. Um zu ermöglichen, dass Nutzer die gesamte Bandbreite an Produkten und Services abrufen können und bei ihrer Schlagwortsuche passgenaue Suchergebnisse erhalten, setzt die Haufe Group in ihrem Geschäftsbereich Editorial Department mittlerweile auf die Datenbanktechnologie von MarkLogic.

Streuverluste durch Datensilos

Content Hub der Haufe Group
Content Hub der Haufe Group: Hinter der Suchfunktion liegt eine leistungsstarke Datenbanktechnologie mit flexiblen Verknüpfungsmöglichkeiten.
(Quelle: Haufe)
Vor Einführung der neuen Datenbanktechnologie vor rund drei Jahren hatte das Unternehmen seine Daten über verschiedene Datentöpfe verteilt, die für jeweils unterschiedliche Applikationen bereitstanden. Eine Verknüpfung der Daten und damit eine Gesamtbetrachtung aller Inhalte war kaum möglich. Nutzer der Website erhielten bei ihrer Schlagwortsuche Ergebnisse, die nur zum Teil das tatsächliche Angebot an verfügbaren Fachinformationen wiedergaben, thematische Querverweise fehlten weitgehend. Die Streuverluste für den Nutzer waren erheblich, Haufe konnte sein Potenzial nicht ausschöpfen.
Ziel war es deshalb, einen zentralen Content Hub aufzubauen, der diese Defizite beseitigt und den Nutzern wesentlich bessere Suchergebnisse liefert. Dabei stand das Team vor der Herausforderung, mit einem gewachsenes System umgehen zu müssen, das auf der Open-Source-Plattform Solr und relationalen Datenbanken basierte.
Darin wurden unterschiedliche Datentypen wie Buch-Metadaten, Widgets, Buchumschläge, Produktinformationen und der eigentliche Content in unterschiedlichen Datensilos gespeichert. Die Abfrage erfolgte über verschiedene Suchmaschinen und Tools. Insgesamt mussten rund 1,5  Millionen Dokumente, meist in XML-Format, in die neue Datenbank integriert werden.
Verwandte Themen