Datenanalyse ohne Direktzugriff

Gewaltentrennung für Daten

von - 03.04.2017
Doch Fortschritt durch Datennutzung setzt nicht einfach nur große Datenmengen voraus, sondern viel eher gute Daten. "Good Data" statt "Big Data". Wenn der Prozess der Datensammlung und -auswertung nicht transparent ist, die Interaktion zwischen Nutzern und Organisationen nicht von Vertrauen geprägt ist, dann wird die Datenqualität irgendwann darunter leiden und auch nicht durch größere Datenmengen kompensiert werden können. Eine Welt voller "Big Bad Data", in welcher der Fortschritt stagniert, ist mindestens ebenso besorgniserregend wie eine "Big Brother"-Welt.
Doch ist das Dilemma zwischen Datenschutz und Datenanalyse ein echtes Dilemma? Die weitläufige Meinung sieht beide Werte zwangsläufig in einer Wechselbeziehung, in der das eine nicht erhöht werden kann ohne das andere zu verringern. Doch diese Ansicht ist technologisch naiv und lässt außer Acht, dass die Gleichung "mehr Datenanalyse = weniger Datenschutz" kein naturgegebenes Prinzip, sondern eher Konvention ist. Ebendiese Konvention bricht das Konzept der "Blinded Analysis" oder zu Deutsch "Blindanalyse": In diesem Ansatz wird die Verantwortung des Datenschutzes dem Datenanalysten entzogen, indem diesem kein direkter Zugriff auf die auszuwertenden Daten selbst, sondern lediglich auf Metadaten und das Ergebnis von vordefinierten Aggregationsanfragen gewährt wird. Somit wird eine Zweckentfremdung verunmöglicht und eine Anonymisierung eingebaut. Zudem werden diese Anfragen vollständig erfasst, um die Transparenz gegenüber Auditoren und Verbrauchern zu steigern.

Praktische Auswirkungen

Auf den ersten Blick scheint dieser Ansatz, Unternehmen und Organisationen in ihrer Analyse zu beschneiden. Doch letzten Endes sollten diese nicht an den Daten selbst, sondern nur an den Anfrageergebnissen interessiert sein. Die eigent­lichen Daten liegen stattdessen in einer separaten Entität des "Datenverwalters", die ausschließlich mit dem Schutz der Daten und der Anfrageerfassung beauftragt ist, ohne selbst auf die Daten zuzugreifen. Diese Dienstleistung der Datenverwaltung wird heute bereits von verschiedenen Cloud-Service-Providern angeboten.
Absoluten Schutz vor Missbrauch bietet der Ansatz der Blindanalyse natürlich nicht. Anstelle des Datenanalysten kann der Datenverwalter, der Zugang zu den Verschlüsselungscodes hat, die Daten prinzipiell zweckentfremden. Doch es ist nicht das Ziel der Blindanalyse, per Design Vertrauen überflüssig zu machen – ein gewisses Mass an Vertrauen wird immer notwendig sein –, sondern die Rollen der Datenanalyse und des Datenschutzes klarer zu trennen und somit zu stärken.
Eine Blindanalyse nun tatsächlich durchzuführen, ist aufwendiger als eine traditionelle Datenanalyse, da der Analyst die Daten nicht direkt inspizieren kann. Doch in Zeiten von Big Data wird genau diese Art der Analyse, die aufgrund der schieren Größe der Datenmengen die Daten selbst nicht vollständig einsehen kann, immer wichtiger. Um solch große Datensätze auswertbar zu machen, müssen bereits in der Phase der Datenbereinigung und -exploration die Anfragen mit hohem Aggregationsgrad – und oftmals ohne direkten Zugriff auf einzelne Einträge – erfolgen.
In der Praxis hätte die Blindanalyse viele Vorteile. Der wichtigste ist das große Potenzial, das Vertrauen zwischen den Organisationen, die Daten auswerten, und den Nutzern, welche die Daten generieren, wiederherzustellen und zu stärken. Ein Unternehmen könnte beispielsweise zweifelsfrei bestätigen, dass es keinen direkten Zugriff auf sensible, personenbezogene Daten hat und lediglich über aggregierte Auswertungen verfügt. Die Tatsache, dass alle Datenanfragen erfasst und geteilt werden, eliminiert die Angst vor Ausspähung und Datenmissbrauch. Die Interaktion zwischen Organisation und Nutzer beziehungsweise Datenanalyst und -generierer, könnte sich in eine vertrauensvollere Konver­sation wandeln, aus der "Good Data" und somit größerer Nutzen für alle Parteien resultiert.
Verwandte Themen