Kluge Maschinen sind auf dem Vormarsch

Eigene Machine-Learning-Projekte

von - 05.01.2017
Machine Learning bietet faszinierende Möglichkeiten und hat sich in den vergangenen Jahren rasant weiterentwickelt. Jürgen Wirtgen, Data Platform Lead bei Microsoft, warnt dennoch vor unrealistischen Erwartungen: „Der am meisten verbreitete Mythos ist, dass Machine Learning Antworten liefert, ohne dass Fragen gestellt werden.“ Am Anfang eines Projekts müssten deshalb eine klare Zieldefinition und die da­raus abgeleiteten richtigen Fragen stehen, so Wirtgen weiter.
Sind diese Fragen gefunden, ist das System zu trainieren – ein weiterer Punkt, der Probleme mit sich bringen kann, weiß AWS-Director Herbrich: „Oft sind weder genügend Daten noch Daten von ausreichend guter Qualität direkt verfügbar.“ Dabei müssen die Daten nicht nur aus den verschiedenen Quellsystemen extrahiert und zusammengeführt, sondern auch für die Analyse aufbereitet, transformiert und auf die relevanten Parameter reduziert werden.
Jakob Rehermann
Geschäftsführer
bei Datapine
„Wir sehen eine große Nachfrage in Vertriebs- und Marketing­abteilungen, die mit Hilfe historischer Daten das Kaufverhalten des Kunden vorhersagen wollen.“
Es gibt bereits erste Software-Lösungen am Markt, die Daten analysieren und Anpassungen vorschlagen, sagt Data­pine-Chef Rehermann. „Generell aber ist die Aufbereitung der Daten stark abhängig vom angewendeten Algorithmus und kann nur bedingt automatisiert werden.“
Eine weitere Frage, die sich nicht ohne Weiteres automatisiert klären lässt, ist die nach der Kostenfunktion. Der Zusammenhang zwischen Nutzen und Aufwand kann beispielsweise linear, progressiv, degressiv oder auch sprunghaft sein. „Beim Einsatz von Machine Learning (…) ist die Kostenfunktion zu finden, die am besten zum Geschäftsproblem passt, das gelöst werden soll“, sagt AWS-Director Herbrich. Bei der Betrugserkennung beispielsweise muss man die Kostenfunktion finden, die Betrugsfälle minimiert, ohne inakzeptabel viele Fehlalarme auszulösen.
Zwei weitere typische Probleme beim Einsatz von Machine Learning sind die Auswahl des geeigneten Algorithmus sowie die Interpretation der Ergebnisse. Die größte Schwierigkeit dabei ist es, unter einer Vielzahl von Ansätzen den sinnvollsten Algorithmus für den aktuellen Anwendungsfall zu finden. „Basierend auf der dabei zugrunde liegenden Logik muss evaluiert werden, wie das Ergebnis interpretiert wird beziehungsweise wie aussagekräftig dieses ist“, sagt Jakob Rehermann von Datapine.

Machine Learning als Blackbox

Keine einfache Aufgabe, denn häufig ist nicht leicht nachvollziehbar, was eigentlich genau bei diesen Analysen passiert. „Viele Machine-Learning-Systeme sind eine Art Blackbox, bei der nur schwer zu verstehen ist, wie ein Ergebnis zustande kommt“, erklärt Crisp-Analyst Daniel Klemm. „Man muss lernen, mit diesen Unsicherheiten umzugehen.“
Dieser Blackbox-Charakter zeichnet vor allem neuronale Netze aus und macht es laut Rehermann oft schwer, die Resultate solcher Machine-Learning-Algorithmen gegenüber Vorgesetzten überzeugend darstellen zu können. „Die Vorgehensweise zum Erhalt der Berechnungsergebnisse bei wichtigen Entscheidungen ist nicht nachvollziehbar.“
Unternehmen sollten deshalb damit beginnen, das notwendige Wissen und Personal aufzubauen, rät Klemm. „Wahrscheinlich hat man diese Experten nicht im Haus.“ Weitere entscheidende Punkte, die beachtet werden müssen, sind Datenschutz und Compliance, so Klemm weiter, „und natürlich braucht man Rechenkapazität“. Je nach Anforderungen seien die Public Cloud, das eigene Rechenzentrum oder auch Multi- beziehungsweise Hybrid-Cloud-Ansätze das Richtige. Anfangs sollte man dabei vor allem auf Flexibilität achten, sagt Klemm. „Man wird sicher nicht von vornherein genau wissen, welche Lösung die richtige ist und wie man sie am besten anwendet.“ Deshalb sei es sinnvoll, zunächst im kleinen Rahmen Experimente zu machen.
Auch Jürgen Wirtgen von Microsoft hält diesen Ansatz für richtig: „Es hat sich in vielen erfolgreichen Projekten gezeigt, dass die ersten Phasen von Machine-Learning-Projekten experimentell geprägt sind. Ein schnelles Scheitern und eine rasche Korrektur von Ansätzen helfen, am Ende eine erfolgreiche Machine-Learning-Lösung zu entwickeln.“
Verwandte Themen