Der Data Scientist und die Nadel im Heuhaufen

Das macht ein Data Scientist im Unternehmen

von - 14.09.2015
Data Science – zu Deutsch Datenwissenschaft – bezeichnet die Extraktion von Wissen aus Daten. Der Begriff selbst ist bereits mehr als 50 Jahre alt, er wurde von dem dänischen Informatiker Peter Naur in den 1960er-Jahren als Alternativbegriff für Informatik geprägt. Seitdem hat sich dessen Bedeutung allerdings grundlegend verändert.
Qualifikationen eines Data Scientists: Das Diagramm zeigt, welche drei Qualifikationen der Data Scientist braucht. Der Schnittpunkt aller drei Eigenschaften (Unicorn) stellt das Ideal dar.
Qualifikationen eines Data Scientists: Das Diagramm zeigt, welche drei Qualifikationen der Data Scientist braucht. Der Schnittpunkt aller drei Eigenschaften (Unicorn) stellt das Ideal dar.
Heute ist es die Aufgabe von Data Scientists, aus einer großen Menge von Daten, die einem Unternehmen aus unterschiedlichen Quellen wie sozialen Netzwerken, Hotlines oder Webshops zufließen, Trends zu erkennen und daraus Handlungsempfehlungen abzuleiten, um beispielsweise effizienter zu werden oder die Kundenzufriedenheit zu erhöhen.
So sind etwa die Produktempfehlungen im Webshop von Amazon das Werk von Data Science. Aber auch in der Versicherungsbranche wird sie für die Tarifierung der Prämien herangezogen oder in der Industrie zur Auswertung der Sensoren von Produktionsmaschinen eingesetzt.
Es zeigt sich: Data Science ist dort wichtig, wo ständig viele Daten anfallen – und das ist mittlerweile fast überall der Fall. Mit der Unterstützung durch Data Scientists können Firmen dann ihre Unternehmensführung optimieren, neue individualisierte Dienstleistungen anbieten oder intelligente Produkte entwickeln.
Steve Geringer, Machine Learning Consultant bei SCG Associates, LLC
Steve Geringer, Machine Learning Consultant bei SCG Associates, LLC: „Data Scientists are as hard to find as unicorns.“

Nach Informationen graben

Betrachtet man die Arbeit eines Data Scientists genauer, so lässt sich daraus ableiten, über welche Qualifikationen er verfügen sollte.
Zum einen muss er sich die Daten beschaffen und sie aufbereiten. Hier sind vor allem Programmierkenntnisse gefordert, mit denen er Programme und Filter erstellt, die die gewünschten Informationen aus dem Datenpool extrahieren.
Mit den Daten selbst lässt sich in der Rohform aber noch nicht viel anfangen, sie müssen gesäubert, formatiert und gegebenenfalls auch transformiert werden.
Aus den aufbereiteten Daten lassen sich anschließend aber immer noch keine Kenntnisse gewinnen. Hier kommt die zweite Qualifikation des Data Scientists ins Spiel, die mathematischen und statistischen Kenntnisse. Dazu gehören Standards wie lineare Regression, Varianzanalyse sowie Visualisierung und Text Mining.
Zur dritten Qualifikation zählen ein grundlegendes Geschäftsverständnis und detaillierte Kenntnisse der Unternehmensziele und -prozesse, die je nach Anwendungsfeld variieren können.
Auf den Punkt bringt es das auf dieser Seite abgebildete Venn-Diagramm von Steve Geringer, Machine Learning Consultant bei SCG Associates, LLC. Sein Diagramm ist eine Weiterentwicklung des Venn-Diagramms des amerikanischen Sozial- und Politikwissenschaftlers Drew Conway.
Es zeigt, wie sich die drei Qualifikationen eines Data Scientists überlappen. Das Feld in der Mitte, dem Schnittpunkt der drei Qualifikationen, hat Steve Geringer Unicorn (Einhorn) genannt. Unicorn steht hier für den Data Scientist. Steve Geringer begründet die Namensgebung in seinem Blog damit, dass seiner Meinung nach Data Scientists so schwer zu finden sind wie Einhörner.
Verwandte Themen