NextGen Analytics - Vorsprung mit KI

Datenökonomie

von - 07.02.2020
KI-Anwendungen in Unternehmen
KI auf dem Vormarsch: Über zwei Drittel der Unternehmen setzen Künstliche Intelligenz (KI) bereits für Datenanalysen ein.
(Quelle: PwC, n = 500 (davon 255 KI-affine und 245 KI-ferne Unternehmen) )
Der zweite große Block an Neuerungen betrifft die Daten selbst und das Datenmanagement.
Daten sind die Basis in KI und Analytics - gleichzeitig aber auch ein heikles Problem. Denn die Datensammlungen sind oft qualitativ zu schlecht, zu unstrukturiert, zu stark verteilt oder zu schmalbrüstig.
Unternehmen verfügen oft nicht über die erforderlichen Datenmengen - entweder weil sie in einem sehr speziellen Umfeld tätig sind oder hoch spezialisierte Produkte in Kleinserien fertigen.
Für dieses Problem zeichnen sich zwei Lösungen ab. Erstens wird daran gearbeitet, maschinelles Lernen auch mit kleineren Datensätzen zu ermöglichen. Dabei möchte man Maschinen dazu befähigen, anhand weniger Beispiele oder durch die Kombination bekannter Beispiele zu lernen. Diese Fähigkeit in ML-Anwendungen zu implementieren wird als One-Shot- oder Zero-Shot-Lernen bezeichnet.
Der zweite Lösungsansatz bei zu wenig Daten liegt darin, die Datenmenge in Kooperation mit anderen Unternehmen zu erhöhen und Datenräume gemeinsam zu nutzen.
Was aber ist zu tun, wenn man zwar Daten hat, diese Daten aus Datenschutzgründen aber nicht nutzen kann? Schließlich verlangt die europäische Datenschutz-Grundverordnung (DSGVO), die persönlichen Daten der Kunden zu schützen und sie auf Verlangen sogar zu löschen. Grundsätzlich können Daten im KI-Umfeld vor dem Trainieren zwar anonymisiert werden, die Anonymisierung von Daten unter Wahrung der Privatsphäre erfordert aber Zeit, Ressourcen und Fachkenntnisse. Zudem ergibt sich immer das Dilemma, zu viel oder zu wenig zu schützen.
Als möglichen Ausweg nennt Gartner die Nutzung synthetischer Daten. Bei dieser Methode wird eine künstliche Repräsentation der zu schützenden Originaldaten generiert, die keinerlei Rückschlüsse mehr auf Personen erlaubt. Ein Machine-Learning-Algorithmus läuft dabei über die Kundendaten, analysiert deren Struktur und lernt durch Training die statistischen Informationen und die statistischen Strukturen der Originaldaten. Mit diesem Wissen erzeugt der Algorithmus neue künstliche Daten. Diese spiegeln den gesamten Datensatz mit seinen statistischen Informationen, statistischen Strukturen und Echtdaten wider.
Der Nutzen synthetischer Daten wird von Experten allerdings kontrovers beurteilt. „Synthetische Daten können es Data Scientists ermöglichen, an KI-Modellen zu arbeiten, ohne reale und sensible Daten einzubeziehen“, sagt zum Beispiel Hendrik Reese von PwC. „Sie können sehr effektiv sein und beispielsweise auch dazu verwendet werden, rasch Proofs of Concept zu erstellen und KI-Initiativen damit zu rechtfertigen.“ Matthias Peissner vom Fraunhofer IAO ist eher skeptisch, was die Anwendbarkeit synthetischer Daten betrifft: „Ob man daraus wirklich neue Erkenntnisse ziehen kann, hängt sehr stark von den Anwendungsfeldern ab“, so Peissner. „Ich halte das in manchen Bereichen, etwa der Medizin, für sehr schwierig.“
Liegen die Rohdaten vor, so wartet eine weitere Hürde: Bevor die Daten analysiert werden können, müssen sie bearbeitet werden. Das erledigen in der Regel Datenwissenschaftler oder andere KI-Experten. Sie verbringen einen großen Teil ihrer Zeit damit, Daten zu sammeln und aufzubereiten - relativ einfache Tätigkeiten, die im KI-Zeitalter weitgehend automatisiert werden können. Diese Automatisierung erledigt Augmented Data Management. Bei diesem erweiterten Datenmanagement werden die Daten mit Hilfe von maschinellem Lernen und KI-Techniken automatisch verfeinert. Die Automatisierung ermöglicht es dann den Fachleuten, sich höherwertigen Aktivitäten zu widmen. Augmented Data Management erlaubt es Daten, wie Gartner es ausdrückt, „sich selbst zu konfigurieren und zu optimieren“. Bis 2022 könnten laut Gartner die manuellen Aufgaben des Datenmanagements durch maschinelles Lernen und automatisierte Workflows um 45 Prozent reduziert werden.
Verwandte Themen