Welche Missverständnisse gibt es beim Thema Data Science?
Viele verwechseln Data Science mit Data Engineering, obwohl es sich dabei um ganz unterschiedliche, wenn auch sich gegenseitig ergänzende Aufgabenbereiche handelt. Data Engineers sind dafür verantwortlich, die Daten erst einmal zu erfassen und so zu strukturieren, dass sie verwertbar werden. Data Scientists hingegen führen Analysen, Experimente und Tests mit diesen Daten durch, damit sie sinnvoll interpretiert werden können. Ergibt schließlich eines der von den Data Scientists entwickelten Modelle eine produktive Anwendung, wird diese an die Data Engineers zur Weiterentwicklung zurückgegeben. Beide Bereiche arbeiten eng zusammen, sind aber jeweils für bestimmte Teile des Projektablaufs zuständig.
Alle drei Zühlke-Data-Scientists meinen, dass Berufsfremde meist eine falsche Vorstellung von ihrem Tätigkeitsgebiet haben. „Oft haben Leute von irgendwelchen angeblich tollen Tools gehört, und die sollst Du dann benutzen – sie denken zum Beispiel, dass Data Scientists die ganze Zeit nur Modellierung machen“, meint Simon.
Andriy kann dem nur beipflichten: „Man hört immer wieder, das sei der Traumberuf des 21. Jahrhunderts, aber die Realität sieht schon ein bisschen nüchterner aus“, erklärt er. Er verweist auf den großen Arbeitsaufwand, bevor man zu den „richtig coolen Sachen“ kommt. „Einen Großteil Deiner Zeit verbringst Du damit, die den Datenmengen innewohnenden Probleme zu verstehen und die Daten für die Analyse und Modellierung vorzubereiten. Erst dann kannst Du etwas damit anfangen“, erklärt er. Andriy beschreibt aber auch die große Genugtuung, wenn man etwas erreicht hat. „Wenn Dein Modell verwendet wird, kannst Du einen greifbaren Wert erkennen, der sich quantifizieren und beziffern lässt“, schwärmt er.