Data Science für Nicht-Programmierer

Tools für Nicht-Programmierer

von - 13.11.2018
Der typische Datenwissenschaftler ist wissbegierig und stets auf der Suche nach neuen Werkzeugen, die ihm helfen, seine Kenntnisse zu vertiefen und neue Antworten zu finden. Und es gibt in der Tat Tools, die hier einen möglichen Ausweg oder zumindest einen Einstieg für Lernwillige bieten. Sie klammern den Programmieraspekt weitgehend aus und setzen zur Bedienung auf eine benutzerfreundliche grafische Oberfläche. So kann sie im Grunde jeder mit minimalen Kenntnissen von Algorithmen einsetzen, um Maschinenlernprozesse oder Vorhersagemodelle zu erstellen.
Trifacta
Übersichtlich: Ein Qualitätsbalken und Histogramme bieten bei Trifacta einen schnellen und grundlegenden Überblick über den Datensatz.
(Quelle: Trifacta)
Viele Unternehmen, denen ausgebildete Spezialisten fehlen oder die gar keine volle Stelle für dieses Aufgabengebiet einrichten wollen oder können, ziehen solche GUI-gestützten Data-Science-Tools als Alternative in Betracht. Dabei gilt allerdings auch hier, dass es die eierlegende Wollmilchsau nun einmal nicht gibt. Komfort bei der Bedienung und Verein­fachungen bei der Modellierung bezahlt man letztlich mit Einschränkungen hinsichtlich Flexibilität und Vielseitigkeit der Lösung.
Dazu kommt, dass die gewonnenen Erkenntnisse meist nicht selbsterklärend sind, sie wollen interpretiert werden. Und gerade bei der Auswertung großer, unstrukturierter Datenbestände sind die Zusammenhänge selten eindeutig, Korrelation bedingt nicht zwangsläufig Kausalität. Berühmt-berüchtigt ist das Beispiel mit dem Vogel: In einem nördlichen Bundesland beobachteten Statistiker, dass in Jahren, in denen besonders viele Störche aus dem Süden zurückkehrten, auch die Geburtenrate in der Bevölkerung signifikant anstieg. Daraus zu schließen, dass der Storch die Babys bringt, wäre jedoch abenteuerlich.
Auch weitgehend automatisierte und bedienfreundliche Data-Science-Tools sind also letzten Endes kein Ersatz für einen gut ausgebildeten und findigen Spezialisten, wenn ein Unternehmen im Zuge der digitalen Transformation verstärkt auf Big Data setzt. Was sie leisten können, ist hingegen eine gewisse Demokratisierung der Methodik, indem sie auch unausgebildeten Nutzern einen Zugang zu einfachen Modellen bieten. Und sie können den Einstieg ermöglichen, wenn ein Unternehmen noch vor der Frage steht, ob Data Science in großem Umfang in die Geschäftsprozesse einfließen sollte oder nicht.
Im Folgenden stellt com! professional sechs Lösungen vor, die erfolgreiches Data Mining auch ohne Universitätsabschluss versprechen: RapidMiner, DataRobot, Driverless AI, Alteryx, BigML und Trifacta Wrangler.
Verwandte Themen