Daten trotz DSGVO ohne Einschränkung nutzen

Dynamisch anonymisieren

von - 18.09.2019
k-Anonymity hat in der Praxis allerdings auch einen Nachteil: Je mehr Dimensionen hinzugefügt werden, desto mehr Informationen müssen anonymisiert werden. Dadurch verschlechtern sich die analytischen Möglichkeiten. Moderne Anonymisierungslösungen wie Differential Privacy oder Diffix sind hier etwas besser aufgestellt.
Diffix ist ein Anonymisierungsansatz, der am Max-Planck-Institut für Softwaresysteme zusammen mit dem Start-up Aircloak entwickelt wurde. Diffix versucht nicht, einen ganzen Datensatz am Stück abzusichern, sondern anonymisiert ihn vielmehr dynamisch bei jeder Abfrage der Datenbank. Die Anonymisierung wird damit an die jeweilige Abfrage und die angeforderten Daten angepasst. Anonymisiert werden die Abfrageergebnisse, indem ein sowohl auf den Input als auch auf den zugrunde liegenden Datensatz zugeschnittenes Rauschen hinzugefügt wird. Es gleicht einem vollautomatischen Filter zwischen Datenbank und Analysten und stellt sicher, dass Letztere zwar mit allen Datenpunkten arbeiten können, aber dies nur geschieht, ohne Rückschlüsse auf einzelne Personen zu erlauben.
Datensätze können damit laut Aircloak schnell, einfach und sicher für neue Anwendungsfälle „entsperrt“ werden und trotzdem kann ein hohes Level an Datenschutz gewährleistet werden. Das vollständig anonymisierte Abfrageergebnis falle nicht mehr unter den Datenschutz der DSGVO und könne somit frei geteilt werden, ohne sich Gedanken darüber zu machen, welches zusätzliche Wissen ein Analyst haben könnte. Der Ansatz wird derzeit unter anderem in der Medizin und im Bankwesen eingesetzt - bei der TeamBank etwa, um Transaktionsdaten anonym auszuwerten.
Die Datenanonymisierungs-Lösung auf Diffix-Basis wird von Aircloak für verschiedene Zielgruppen angeboten. „Aircloak hat Forschungsarbeiten des Max-Planck-Instituts für Softwaresysteme weiterentwickelt und so eine hochentwickelte und gleichzeitig einfach zu handhabende Lösung für Kunden geschaffen, die maximale Datensicherheit und Datenschutz gewährleistet”, schwärmt Florian Kirschenhofer, Start-up & Portfolio Manager bei Max-Planck-Innovation, der Technologietransfer-Organisation der Institute der Max-Planck-Gesellschaft.

Hersteller / Software

Beschreibung

Aircloak / Aircloak Insights

Diffix-Anonymisierungslösung auf DSGVO-Niveau für qualitativ hochwertige Analysen unter Wahrung einer starken Anonymisierung. Anonymisierbar sind Daten aus allen Bereichen, einschließlich Banken- und Gesundheitswesen

ARX Team, TU München / ARX Data Anonymization Tool

Open-Source-Software für große Datensätze; unterstützt k-Anonymity (oder seine Varianten l-diversity, t-closeness, b-likeness) und Differential Privacy, kann für bis zu 50 Dimensionen und Millionen von Datensätzen verwendet werden. Bietet auch eine grafische Bedienoberfläche und integrierte Datenimportfunktionen

Athena Research Center / Amnesia

Wandelt relationale und transaktionale Datenbanken in Datensätze um, in denen formale Datenschutzgarantien gelten. Konzentriert sich auf k-Anonymität. Anonymisierung kann angepasst werden, sodass das richtige Gleichgewicht zwischen Datenschutz und Datennutzen gefunden werden kann

Eyedea Recognition / Anonymizer SDK

Eigenständige C/C++-Bibliothek für Windows und Linux. Erkennt Gesichter, Autonummern-schilder und andere Bildinformationen und wendet Unschärfenfilter an, um die Informationen unlesbar zu machen. Verwendbar, um Straßenansichtsfotos, Webcam-Fotos oder andere Fotos zu anonymisieren

Realroflje / Anonimatron

Open-Source-Werkzeug, das Datensätze pseudonymisiert und dazu verwendet werden kann, pseudonymisierte Produktionsdaten zu erzeugen. Mit Inkrafttreten der DSGVO wurde eine Funktion hinzugefügt, die die Anonymisierung von Dateien ermöglicht

Statice / Statice

Generiert auf Basis von Machine-Learning-Verfahren aus Produktivdaten synthetische Daten. Die künstlichen Daten haben die analogen statistischen Eigenschaften wie die Originaldaten, können aber frei verwendet werden und unterliegen nicht mehr der DSGVO

Statistics Netherlands/CASC / μ-Argus

Bietet eine Vielzahl verschiedener statistischer Anonymisierungsmethoden wie Randomisierung, Hinzufügen von Rauschen, Mikroaggregation. Verwendbar auch für die Generierung synthetischer Daten. Wird vom niederländischen Büro für Statistik eingesetzt

Templ Matthias / sdcMicro

Generiert anonymisierte (Mikro-)Daten für die öffentliche und wissenschaftliche Nutzung. Das zugehörige Paket sdcMicroGUI beinhaltet ein GUI zur Verwendung verschiedener Ano-nymisierungs-Methoden

Verwandte Themen