Predictive Analytics schlagen das Bauchgefühl

Einsatzszenarien der Predictive Analytics

von - 05.02.2016
Bessere Prognosen kann jeder gebrauchen. Deshalb sind die Einsatzszenarien vielfältig. Microsoft-Manager Hans Wieser nennt IT-Sicherheitssysteme wie Intrusion Detection and Prevention sowie die Betrugsprävention bei Finanzdienstleistern und Telekommunikationsunternehmen als typische Beispiele.
Jakob Rehermann
Geschäftsführer Datapine
www.datapine.com/de
„Wo man früher eine Datenbank eingesetzt hat, nutzt man heute viele verschiedene Datenquellen.“
Heleen Snelting von TIBCO zählt die Betrugserkennung in Echtzeit, prädiktive Instandhaltung (Predictive Maintenance), die Routenoptimierung, das Supply-Chain- und Risikomanagement, das Kundenmarketing und das Mobile Asset Management zu den Haupteinsatzgebieten.
Eine Branche, die sehr stark von den neuen Vorhersagemethoden profitiert, ist der Handel. Amazon etwa generiert einen Großteil seines Umsatzes über die Produktempfehlungen, die jedem Kunden eingeblendet werden, der sich auf der Webseite des Online-Händlers eingeloggt hat. Sie beruhen auf fortgeschrittenen Analysen und beziehen eine Vielzahl von Faktoren wie das individuelle Kaufverhalten, den aktuellen  Warenkorb, die lang- und kurzfristigen Abverkaufszahlen eines Produkts, die Preisentwicklung und sogar Erwähnungen in Tweets und Likes mit ein.
Werkzeuge für fortgeschrittene Analysen
Diese Statistikpakete, Big-Data-Frameworks und Programmiersprachen werden häufig für Data Mining und Predictive Analytics eingesetzt.

Programm

Beschreibung

Apache Spark

Big-Data-Framework zur verteilten In-Memory-Berechnung auf Basis großer Datenmengen. Die Funktionsbibliothek MLib macht maschinelles Lernen für Spark-Systeme verfügbar

Jupyter (IPython)

Interaktive Bedienoberfläche für über 40 Programmiersprachen zur Datenbereinigung und -transformation, für Simulationen, statistisches Modellieren, Machine Learning und andere Aufgaben

Python

Höhere Programmiersprache, die objektorientierte, aspektorientierte und funktionale Programmierung sowie eine dynamische Typisierung erlaubt. Python gilt als relativ einfach zu erlernen und wird meist in Form von Skripts angewendet

R

Open-Source-Programmiersprache zur Modellierung statistischer Fragestellungen, die durch zahlreiche Pakete im Funktionsumfang erweitert werden kann. Im zentralen CRAN-Archiv (Comprehensive R Archive Network) finden sich über 5000 Pakete. R wird per Kommandozeile bedient, es existieren aber grafische Bedienoberflächen wie RStudio, R-Commander und relax. Außerdem gibt es kommerzielle Implementierungen wie Revolution R oder MapR

Scala

Steht für Scalable Language; skalierbare, objektorientierte Programmiersprache, die unter anderem von Twitter, LinkedIn und Intel zur Datenanalyse eingesetzt wird

Weka

Abkürzung für Waikato Environment for Knowledge Analysis; Weka wurde an der neuseeländischen Waikato-Universität entwickelt. Weka erlaubt die Analyse von Klassifikationen und Assoziationen mit Hilfe von maschinellem Lernen

Im öffentlichen Raum sind es vor allem die Bereiche Verkehrssteuerung, Energie und Verbrechensprävention, auf denen die größten Hoffnungen liegen. „Wenn ich Verkehrsflüsse besser verstehen und Staus vermeiden will, wenn ich Grids (Stromnetze) besser managen will, um Black-outs zu vermeiden, wenn ich alternative Energiequellen intelligenter integrieren will, brauche ich prädiktive Modelle“, beschreibt Christian Dornacher, Director, Storage and Analytics Solutions bei Hitachi Data Systems, die Entwicklung der Städte zu „Smart Cities“. Datapine-Geschäftsführer Rehermann führt als Beispiel ein Präventionsprogramm für ehemalige Häftlinge in Baltimore und Philadelphia an: „Mit Predictive Analytics konnte die Rückfallquote um 30 Prozent gesenkt werden.“
Zu erwähnen ist noch das Gesundheitswesen, das Predictive Analytics bei der Prognose von Krankheiten, aber auch in der Vorsorge und bei der Berechnung von Epidemieverläufen einsetzt. So hat beispielsweise Google mit Flu Trends eine Möglichkeit gefunden, Grippewellen vorherzusagen. Eine Analyse von Milliarden Datensätzen aus den vergangenen zehn Jahren ergab 144 Suchbegriffe, die für ein tagesgenaues Vorhersagemodell relevant sind. „Entscheidend war, dass Google komplett ergebnisoffen an die Analyse ging und nicht von vorneherein Suchbegriffe definiert hat“, sagt Pentaho-Manager Claßen.
Mit Predictive Analytics sind nicht nur erstaunlich genaue Vorhersage-, sondern auch völlig neue Geschäftsmodelle möglich. So setzt die in Deutschland umstrittene Taxi-Alternative Uber auf fortgeschrittene Analysemethoden. Der Erfolg des Unternehmens hängt unter anderem davon ab, dass es sehr genau vorhersagen kann, wo der größte Bedarf an Mitfahrgelegenheiten entstehen wird, ja sogar, wohin die Fahrgäste gebracht werden wollen.
Ein weiteres Beispiel sind die Finanztechnologie-Unternehmen (FinTech), deren Geschäftsmodell auf der Auswertung von Social-Media-Daten beruht. Mit deren Hilfe konnten sie Scoring-Modelle entwickeln, die es erlauben, die Kreditwürdigkeit von Menschen einzustufen, die nicht über eine Kredithistorie verfügen.
Verwandte Themen