Machine Learning von der Stange

Interview mit Lars Schwabe, Leiter Data Insight Lab bei Lufthansa Industry Solutions

von - 07.04.2017
Lars Schwabe von Data Insight Lab
Lars Schwabe ist der Leiter des Data Insight Lab im Technologie Innovation Center der Lufthansa Industry Solutions.
(Quelle: Lufthansa )
Lars Schwabe leitet das Data Insight Lab im Technology Innova­tion Center der Lufthansa Industry Solutions, das konzerninterne, aber auch externe Kunden bei der Umsetzung ihrer Datenstrategie unterstützt. Im Gespräch mit com! professional erklärt er, welche Rolle Machine Learning spielt und was Unternehmen beim Einsatz von Machine-Learning-Frameworks beachten müssen.
com! professional: Herr Schwabe, Sie setzen in Ihren Projekten häufig Machine-Learning-Methoden ein. Ist der Zugang zu Machine Learning durch die heute verfügbaren Frameworks leichter geworden?
Lars Schwabe: Ja, der Einstieg ist dadurch sehr viel einfacher. Frameworks schaffen so etwas wie Standards. Unternehmen müssen nicht mehr für jedes Machine-Learning-Projekt das Rad neu erfinden. Natürlich braucht man neben den Tools auch das Verständnis dafür, was die zugrunde liegenden Algorithmen tun und welche mathematischen Prinzipien dahinterstehen. Anders als in den 1990er-Jahren, in denen das Feld noch sehr stark wissenschaftlich geprägt war, passiert heute aber der Fortschritt bei Machine Learning vor allem an der Schnittstelle zwischen den Technologien und den Algorithmen.
com! professional: Wie findet ein Unternehmen das richtige Framework für seine Zwecke?
Schwabe: Auf diese Frage gibt es keine einfache Antwort. Wie bei anderen Technologien auch muss jeder CIO oder Entwicklungs-Chef die bestehende IT-Infrastruktur, das im Unternehmen vorhandene Know-how, die Randbedingungen und Abhängigkeiten berücksichtigen. Wenn es beispielsweise sehr viele Entwickler mit Java-Kenntnissen gibt, wird die Antwort anders ausfallen, als wenn dies nicht der Fall ist. Prinzipiell kann man aber zwei große Strömungen bei den Frameworks unterscheiden: Das sind zum einen Entwicklungen im Python-Umfeld, zum anderen ist es die Open-Source-Lösung Apache Spark mit ihren Machine-Learning-Bibliotheken.
com! professional: Bieten die verfügbaren Frameworks einen durchgängigen Workflow von der Modellierung bis hin zum operativen Einsatz?
Schwabe: Nein, so weit sind wir noch nicht. Es gibt zum Beispiel noch keine Open-Source-Tools oder kommerziellen Anwendungen, um Modelle zu verwalten, sie anlernen, überwachen und archivieren zu können. Zwar existieren hier und da proprietäre Insellösungen, aber oft mangelt es an Flexibilität und ein Vendor-Lock-in droht. Es fehlt derzeit so etwas wie DevOps für Data Science und Machine Learning. Dafür bräuchten wir auch eine neue Rolle in der IT, die ich in Anlehnung an den Data Engineer als Machine Learning Engineer bezeichne.
com! professional: Braucht man im Unternehmen denn zwingend solche Experten? Die Cloud-Provider bieten doch einfach zu integrierende Machine-Learning-Services, die sich über APIs ansprechen lassen.
Schwabe: Der Trend geht tatsächlich in diese Richtung. Jeder Frontend-Entwickler ist heute in der Lage, sich aus diesen Services zum Beispiel einen Chatbot zusammenzuklicken. Auf lange Sicht ist das aber eine problematische Strategie.
com! professional: Warum? Schließlich lassen sich so doch sehr schnell Ergebnisse erzielen.
Schwabe: Ja, aber die Kompetenz für diese Technologien liegt beim Dienstleister. Die spannende Frage ist, ob es den Unternehmen gelingt, selbst das notwendige Know-how für Machine Learning aufzubauen. Damit will ich nicht sagen, dass man alles selbst entwickeln muss. Wer aber weiß, was er tut, und bei Bedarf auch tiefer in die Materie einsteigen kann, ist klar im Vorteil, macht sich nicht abhängig von einem Provider und behält vor allem auch die Hoheit über seine Daten. Man sollte kritisch abwägen, ob man Kernkompetenzen an technische Dienstleister auslagern will.
com! professional: Ist nicht Schnelligkeit auch ein wichtiger Erfolgsfaktor? Der Wettbewerb ist womöglich schon längst davongezogen, bevor ich im Unternehmen das nötige Know-how aufgebaut habe.
Schwabe: Es spricht nichts dagegen, die Services von Dienstleistern zu nutzen, um schnell zu Ergebnissen zu kommen. Der Entscheider im Unternehmen muss aber das ganze Bild sehen. Er muss sich fragen, ob das reicht. Man kann schnell mit APIs Erfahrungen sammeln, sollte aber begleitend intern Kompetenz aufbauen. Sonst besteht die Gefahr, dass man sich „Code Monkeys“ züchtet, die nichts anderes können, als Mashups zusammenzuklicken.
com! professional: Sie haben von Abhängigkeiten gesprochen, die man beim Einsatz von Machine Learning beachten sollte. Was genau verstehen Sie darunter?
Schwabe: Wer „schnell mal“ mit Machine Learning eine Lösung aufbaut und einsetzt, geht technische Schulden ein. Das muss nicht notwendigerweise ein Problem werden, man sollte sich dessen aber bewusst sein.
com! professional: Was sind das für technische Schulden?
Schwabe: Lernende Systeme treffen anhand der zur Verfügung gestellten Daten Vorhersagen und letztendlich auch Entscheidungen, die wiederum Einfluss auf die Daten haben können. Diese Abhängigkeiten sind oft implizit und überraschend.
com! professional: Können Sie das an einem Beispiel erläutern?
Schwabe: Nehmen Sie etwa ein System, das Kaufabbrüche verhindern soll, indem es potenzielle Abbrecher erkennt und ihnen zusätzliche Rabatte offeriert. Diese Angebote haben natürlich wieder Auswirkungen auf das Verhalten der Nutzer. Die Kunden erkennen womöglich, dass sie Geld sparen können, wenn sie den Warenkorb an einer bestimmten Stelle verlassen, und nutzen das aus. Das kann bis zum sogenannten Adversarial Machine Learning gehen, bei dem Angreifer bewusst die Lernfähigkeit eines Systems für ihre Zwecke missbrauchen und es mit manipulierten Daten aushebeln. Es gibt ein sehr gutes Paper von Google „Machine Learning: The High Interest Credit Card of Technical Debt“.  Es sollte Pflichtlektüre für jeden sein, der sich mit dem Thema beschäftigt.
com! professional: Wie gehen Sie bei Lufthansa Industry Solutions vor, wenn Sie mit Hilfe von Machine Learning eine Lösung entwickeln?
Schwabe: Für eine erste Machbarkeitsstudie nutzen wir meist vorgefertigte Services, beispielsweise von IBM Watson. Prototypen bauen wir ebenfalls meist serviceorientiert, es kann aber durchaus sein, dass wir in dieser zweiten Stufe bereits einzelne Funktionen selbst entwickeln, wenn die verfügbaren Dienste nicht ausreichen. Beim Übergang in den Produktivbetrieb überlegen wir dann sehr genau, welcher Ansatz der richtige ist. Bild- und Spracherkennung lassen sich problemlos per API als Service beziehen, aber wenn es etwa um automatisierte Kauf- und Verkaufsentscheidungen geht, benötigt ein Unternehmen mehr Kontrolle und Monitoringmöglichkeiten. So etwas bauen wir dann passgenau für den Kunden.
com! professional: Nutzen Sie dazu die verfügbaren Frameworks?
Schwabe: Ja, wir verwenden zum Beispiel Spark, wenn es um Batch-Verarbeitung und Big Data geht. Bei wirklich neuen Fragestellungen entwickeln wir auch eigene Lernalgorithmen. Das ist aber eher die Ausnahme.
Verwandte Themen