Blinded Analysis

Datenanalyse ohne Direktzugriff

von - 03.04.2017
Datenanalyse
Foto:
Blindanalysen erlauben die Nutzung von Big Data ohne dabei den Datenschutz und das Vertrauen der Nutzer zu gefährden. Ermöglicht wird dies durch eine Gewaltentrennung für Daten.
Dieser Artikel wurde von Luigi Scorzato, Data Engineering Manager, und Stefan Rustler, Analytics Consultant bei Accenture Digital, verfasst.
Noch im 19. Jahrhundert betrug die Lebenserwartung eines Neugeborenen durchschnittlich 40 Jahre. Heute liegt sie in entwickelten Ländern bei etwa 80 Jahren. Der wissenschaftliche Fortschritt – v. a. in der Medizin – hat uns effektiv ein zweites Leben beschert. Ohne die systematische Analyse medizinischer und auch anderer sensibler Daten ­wäre diese Errungenschaft undenkbar. Daten bilden das Fundament für Medizin, Wissenschaft und Wohlstand.
In jüngerer Zeit haben neuartige Methoden und die stetig wachsende Rechenleistung uns befähigt, große Datenmengen in den verschiedensten Bereichen zu sammeln und auszuwerten. Die Folge sind entsprechende Verbesserungen beispielsweise in Gesundheit, Bildung, Kommunikation oder Transport.

Datenschutz vs. Datennutzung

Um weitere Verbesserungen zu erreichen, führt kein Weg an der Nutzung sensibler oder personenbezogener Daten vorbei. Und diese Verbesserungen sind nötig, denn eine funk­tionierende Welt mit 10 Milliarden Menschen, die nicht datengetrieben ist, ist kaum vorstellbar. Wir stoßen schon jetzt an die Grenzen unserer Ressourcen, der Optimierungsdruck wächst weiter.
Allerdings gibt es legitime Bedenken zu Datenschutz und möglichem Missbrauch, wenn personenbezogene Daten involviert sind. Leider gehen viele Organisationen nicht adäquat mit solchen Bedenken um und die Gesetzgebung hinkt hinterher. Der Versuch, den Nutzer eines Services zu beschwichtigen, kann gar nach hinten losgehen: Viele Nutzungsvereinbarungen wirken schon durch ihren Umfang erschlagend. Erreicht man die Passagen, in denen andere Nutzungszwecke erläutert werden, sind sie schwammig formuliert. Auch der Ausschluss der Weitergabe der Daten an Dritte beruhigt nur bedingt: Was ist heute wirklich innerhalb und was außerhalb großer multinationaler Organisationen?
Selbst die Zusicherung, dass personenbezogene Daten anon­ymisiert werden, ist oft unzulänglich. Denn in vielen Fällen müsste man eigentlich von einer Pseudonymisierung sprechen: Offensichtlich sensible Felder wie Namen oder Adressen werden gelöscht oder durch Hilfsschlüssel ersetzt. In manchen Situationen reicht das aus, aber im Allgemeinen ist dies keine Garantie dafür, dass man individuelle Identitäten mit Daten, die zunächst unbedenklich scheinen, nicht rekons­truieren kann. Analysiert man zum Beispiel die Handy-Verbindungsdaten in einer dünn besiedelten Gegend, kann das Aggregationslevel bezüglich Lokation zu niedrig sein, um ausreichend Anonymisierung zu bieten.
Jedoch ist die vollkommene Anonymisierung auch keine universelle Lösung, da sehr granulare oder individuelle Informationen für eine bedeutsame Analyse manchmal eben gebraucht werden. Um beispielsweise das Elektrizitätsnetz einer Stadt zu optimieren, bedarf es der genauen Daten örtlicher und zeitlicher Nutzungsprofile. Dieses Dilemma zwischen wirklichem Datenschutz und nutzenstiftender Datenanalyse zu lösen, ist die Voraussetzung für den Weg in eine bessere Zukunft.
Verwandte Themen