Menschen und Kultur

Data Science in den Griff bekommen: Eine Karriere als Data Scientist

Data Scientists at work

Im Gespräch mit Data Scientists bei Zühlke stellten wir fest, dass es keine einheitliche Definition von Datenwissenschaft bzw. Data Science zu geben scheint. „Es hat schon was von Forschung“, sagt Simon Debski. „Wenn wir uns an ein Problem setzen, wissen wir vorher nicht, wie die Lösung aussehen wird. Als Data Scientists stellen wir eine Hypothese auf, testen diese, werten die Ergebnisse aus und wiederholen den Vorgang so lange, bis wir ein Ergebnis haben. Das ist wirklich spannend.“

 

Du möchtest wissen, wie der Arbeitsalltag eines Data Scientist aussieht? Für diesen Beitrag haben wir uns mit Simon, Daphne und Andriy aus dem Zühlke-Team unterhalten, um mehr über ihre Arbeit zu erfahren und warum es dabei um mehr geht als um maschinelles Lernen und KI.

6 Minuten to read
Autor

Was machen Data Scientists?

Data Science ist ein weites Gebiet, bei dem es im Kern um den Prozess der Gewinnung von Erkenntnissen aus Daten geht. Data Scientists wenden verschiedene Modelle und Algorithmen an, um aus mit Störfaktoren behafteten, unübersichtlichen Datenmengen relevante Informationen zu gewinnen. Das ist aber nur ein Aspekt der Arbeit als Data Scientist. Meist gibt es gar keine klaren Vorgaben, sodass sie die Aufgabenstellung selbst definieren müssen. Andriy Rekalo, einer der Data Scientists bei Zühlke, erklärt: „Die eigentliche Frage ist nicht das ‚Wie‘, sondern das ‚Was‘: welches Problem sollten wir überhaupt lösen, welcher Wert steckt in den Daten und wie kann ich diesen freisetzen?“

Welche Missverständnisse gibt es beim Thema Data Science?

Viele verwechseln Data Science mit Data Engineering, obwohl es sich dabei um ganz unterschiedliche, wenn auch sich gegenseitig ergänzende Aufgabenbereiche handelt. Data Engineers sind dafür verantwortlich, die Daten erst einmal zu erfassen und so zu strukturieren, dass sie verwertbar werden. Data Scientists hingegen führen Analysen, Experimente und Tests mit diesen Daten durch, damit sie sinnvoll interpretiert werden können. Ergibt schließlich eines der von den Data Scientists entwickelten Modelle eine produktive Anwendung, wird diese an die Data Engineers zur Weiterentwicklung zurückgegeben. Beide Bereiche arbeiten eng zusammen, sind aber jeweils für bestimmte Teile des Projektablaufs zuständig.

Alle drei Zühlke-Data-Scientists meinen, dass Berufsfremde meist eine falsche Vorstellung von ihrem Tätigkeitsgebiet haben. „Oft haben Leute von irgendwelchen angeblich tollen Tools gehört, und die sollst Du dann benutzen – sie denken zum Beispiel, dass Data Scientists die ganze Zeit nur Modellierung machen“, meint Simon.

Andriy kann dem nur beipflichten: „Man hört immer wieder, das sei der Traumberuf des 21. Jahrhunderts, aber die Realität sieht schon ein bisschen nüchterner aus“, erklärt er. Er verweist auf den großen Arbeitsaufwand, bevor man zu den „richtig coolen Sachen“ kommt. „Einen Großteil Deiner Zeit verbringst Du damit, die den Datenmengen innewohnenden Probleme zu verstehen und die Daten für die Analyse und Modellierung vorzubereiten. Erst dann kannst Du etwas damit anfangen“, erklärt er. Andriy beschreibt aber auch die große Genugtuung, wenn man etwas erreicht hat. „Wenn Dein Modell verwendet wird, kannst Du einen greifbaren Wert erkennen, der sich quantifizieren und beziffern lässt“, schwärmt er.

Wie wird man Data Scientist?

Wie der Name nahelegt, beschäftigen sich Data Scientists sehr viel mit Daten und müssen daher verstehen, wie diese funktionieren. „Man sollte sich erst einmal eine solide Grundlage in Statistik aneignen. Außerdem ist es hilfreich, wenn Du weißt, wie man Daten handhabt – vor allem große Datenmengen“ meint Daphne Tsallis. Darüber hinaus brauchst Du aber auch ein gewisses technisches Können „Deine Arbeit mit den Daten umfasst Aufgaben wie Datenbereinigung, Datenvisualisierung und Datenanalyse. Daher solltest Du auch programmieren können – Kenntnisse in Python oder R sind hier von Vorteil“, sagt Simon.

Alle drei empfehlen, dass Du praktische Erfahrungen sammeln solltest, um sicher zu sein, dass der Beruf der richtige für Dich ist. Simon schlägt vor, sich für Projekte und Wettbewerbe auf Websites wie Kaggle anzumelden und dann ein Portfolio zusammenzustellen, bevor Du Dich an potenzielle Arbeitgeber wendest. So kannst Du auch Andriys Tipp befolgen und diejenige Teildisziplin von Data Science finden, die Dir am meisten Spaß macht, und auf die Du Dich spezialisieren kannst. „Du solltest Dich davor hüten, Dich ausschließlich mit der derzeit angesagten Technologie zu befassen. Vielmehr solltest Du einen Bereich finden, der Dich wirklich interessiert“, meint er.

Warum Data Scientist werden?

Alle drei Teammitglieder schätzen etwas anderes an ihrer Aufgabe, aber alle finden Selbstverwirklichung in ihrer Arbeit. Für Andriy ist es die „Forschung“, die ihn an Data Science besonders reizt. „Man macht Experimente und weiß nicht immer, was dabei herauskommen wird. Es gibt viel weniger Gewissheiten als bei der herkömmlichen Softwareentwicklung – aber genau das macht Data Science so interessant“, findet er. Für Daphne macht neben der Forschung die Dynamik den Reiz ihrer Arbeit aus: „Es macht mir Spaß, neue Signale in den Daten zu erkennen – es ist spannend, verschiedene Theorien und Experimente anzuwenden, um herauszufinden, warum etwas Bestimmtes passiert“, sagt sie.

Ein wichtiger Aspekt, den alle im Zusammenhang mit Data Science bei Zühlke nennen, ist die Gemeinschaft in der Praxis. Die Data Scientists des Unternehmens und alle an dem Thema interessierten Kolleginnen und Kollegen unterstützen sich gegenseitig über formelle und informelle Kanäle. „Letzten Endes geht es darum, Zühlkes Kompetenz und Angebot im Bereich der Datenwissenschaft auszubauen“, meint Simon. Als Beispiele nennt er Initiativen wie den Aufbau einer Dokumentation vergangener Projekte zur Unterstützung von Vertrieb und Produktion, die Zusammenarbeit an der Entwicklung neuer Standarddatenangebote und die Unterstützung der Arbeit gemeinnütziger Organisationen.

Worauf alle drei immer wieder zurückkommen, ist das große Zufriedenheitsgefühl, wenn sich der Arbeitseinsatz ausgezahlt und einen sichtbaren Wert in der realen Welt geschaffen hat. Das kann ein Riesenprojekt sein wie die Unterstützung bei der Entwicklung der Modelle für die Covid-19 Test-and-Trace App des NHS oder auch so etwas wie die automatische Schadensbeurteilung in einer Versicherungs-App, die vielen das Leben leichter macht. Simon formuliert es so: „Wenn ich ein konkretes Ergebnis sehe, fühlt sich das für mich noch immer so an, als hätte ich ein kleines Wunderwerk vollbracht.“

Du möchtest mehr erfahren? Dann schau Dich auf unserer Data-Science-Seite um!

Kurz und knapp zusammengefasst ...

  • Data Scientists untersuchen gemeinsam mit ihren Teams, welche Fragen mithilfe von Daten beantwortet werden können und wie dabei am besten vorzugehen ist.
  • Neben einer soliden statistischen und mathematischen Grundlage sind gewisse technische Skills notwendig, um mit konkreten Daten arbeiten und Experimente durchführen zu können.
  • Bei Data Science geht es nicht um eine bestimmte Technologie oder Methodik, sondern darum, den richtigen Ansatz zu finden, um die Daten für ein bestimmtes Projekt sinnvoll zu nutzen.