Der Schlüssel zum Datenschatz

Anwendungsbeispiel: Roche Diagnostics

von - 21.09.2023
Da es sich bei Data Mesh um ein neues Konzept handelt, hält sich die Zahl der Unternehmen in Grenzen, die bereits entsprechende Konzepte umgesetzt haben. Ein Anwender ist der schweizerische Pharmakonzern Roche. Dessen Sparte Roche Diagnostics startete 2020 ein auf zwei Jahre ausgelegtes Migrationsprojekt, um die bestehende IT-Umgebung in Richtung Cloud-Services und eines modernen Data Stack weiterzuentwickeln. Ein Grund war, dass die Entwicklung von daten- und analysebasierten Produkten für Kunden und Patienten zu langsam ablief. Neue Releases wurden nur alle drei Monate zur Verfügung gestellt.
Ein Kernelement der neuen Strategie war die Einführung eines Data Mesh. Parallel dazu implementierte Roche Diagnostics ein agiles Warehouse auf Basis der Modellierungstechnik Data Vault 2.0. Das Data Mesh besteht aus drei Ebenen. Die erste ist eine Plattform, die das Erstellen von Datenprodukten durch Domänen unterstützt. Das entsprechende Team prüft beispielsweise, mit welchen Methoden sich Datenprodukte auffinden lassen und welche Data Products benötigt werden, um bestimmte Geschäftsanforderungen zu erfüllen.
Die zweite Ebene beschäftigt sich mit der „Mesh Experience“. Es wird beispielsweise erfasst, welche Domains vorhanden sind, welche Datenprodukte sie erzeugen und für welche Use Case sie tauglich sind. Dies erfolgt mithilfe von Lösungen von Anbietern wie Monte Carlo, Collibra und Immuta.
Die erforderliche Infrastruktur stellt eine dritte Ebene bereit. Sie umfasst (Cloud-)Storage- und Compute-Ressourcen von AWS, Google und Microsoft Azure, zudem eine Data-Cloud-Plattform von Snowflake und ein API-Management. Hinzu kommen Lösungen für die Data Ingestion, also das Importieren von großen Datenmengen aus unterschiedlichen Quellen in ein zentrales Speichermedium.
Ein Effekt des Data Mesh ist, dass sich bei Roche Diagnostics die Entwicklungszeiten verkürzt haben, bis ein MVP (Minimum Viable Product) bereitsteht – von etwa sechs Monaten auf sechs bis acht Wochen. Die Zahl der Releases von Anwendungen stieg zudem auf mehr als 120 pro Monat. Außerdem gelang es Roche Diagnostics, sein Datenökosystem auszubauen, etwa durch Einbindung von externen Partnern.

Voraussetzungen und Anforderungen

Basierend auf den eigenen Erfahrungen haben Fachleute von Roche und der Lösungslieferanten einige Punkte zusammengestellt, die für den Erfolg von Data-Mesh-Projekten wichtig sind. Ein zentraler Faktor ist demnach: Ein Unternehmen muss willens sein, Änderungen auf der organisatorischen Ebene vorzunehmen. Das Konzept von Domänen, Datenprodukten und Product Owners verlangt sowohl von IT- und Datenspezialisten als auch den Fachabteilungen ein Umdenken und eine Anpassung bestehender Abläufe – keine einfache Aufgabe.
Marc Kleff
Director Solutions Engineering bei NetApp Deutschland
Foto: NetApp
„Letztlich funktioniert ein Data Mesh nur, wenn die Product Owner die entsprechenden Kenntnisse mitbringen.“

Ebenso wie bei anderen Technologien, etwa KI und Machine Learning, sollten außerdem stimmige Use Case erarbeitet werden. Mal eben schnell Data Meshs und Data Fabrics einzuführen, funktioniert nicht. Es muss klar definiert sein, auf welche Weise ein Mesh dazu beitragen kann, Geschäftsanforderungen zu erfüllen. Hilfreich ist zudem, wenn der Anwender bereits Erfahrungen mit einem dezentralen Business-Intelligence- und Analytics-Ansatz hat.
Hinzu kommt, dass es keine schlüsselfertigen Data-Mesh-Lösungen gibt. Ein Anwender muss daher mit Anbietern aus unterschiedlichen Sparten zusammenarbeiten. Dazu zählen Spezialisten für das Einspeisen (Ingestion), Modellieren und Virtualisieren von Daten. Hinzu kommen Unternehmen, die Lösungen für Data Discovery und Observability, für das Bereitstellen von Datenprodukten sowie für Storage- und Rechenkapazitäten. Dies stellt hohe Anforderungen an die Projektkoordination, in fachlicher und personeller Beziehung.
Zwei weitere Faktoren dürften sich für viele Unternehmen als besonders hohe Hürden erweisen: Es sind gut qualifizierte Data Engineers erforderlich. Außerdem sollte das Unternehmen bereits einen Gutteil des Weges zu einem Data-Driven Enterprise absolviert haben, also die technischen, organisatorischen und betriebskulturellen Grundlagen geschaffen haben.
Die erste Anforderung zu erfüllen, dürfte wegen des notorischen Mangels an Datenspezialisten schwerfallen. „Letztlich funktioniert ein Data Mesh nur, wenn die Product Owner die entsprechenden Kenntnisse mitbringen. Hier liegen die größten Herausforderungen“, betont Marc Kleff von NetApp. Es gehe allerdings nicht darum, sämtliche Kompetenzen auf niedrigerer Ebene zu duplizieren, sondern Dezentralisierung intelligent aufzusetzen. „Die Teams verwenden ihre Daten als Produkt, aber sie kümmern sich nicht um sämtliche datenrelevante Belange. Sonst wird Data Mesh zum Komplexitätstreiber und Ressourcenfresser.“
Doch auch der zweite Punkt, also die Voraussetzungen für eine datenbasierte Strategie und Wertschöpfung zu schaffen, stellt eine Herausforderung dar. Denn laut der Studie „Data-Driven Enterprise 2023“ von IDG haben nur 36 Prozent der Unternehmen in Deutschland eine Datenstrategie entwickelt. Und ganze 29 Prozent verfügen über ein Datenmanagement. In der Schweiz dürften die Lage ähnlich sein. Somit müssen zunächst solche Defizite beseitigt werden.
Verwandte Themen