Berlin (dpa/tmn) – Daten über Daten: Sie aufzubereiten und für Unternehmen nutzbar zu machen, das ist der Job von Data Scientists. Dazu gehören komplexe mathematische und statistische Modellierungen, Programmieren – und natürlich: KI, also Künstliche Intelligenz.
Duote Chen ist Data Scientist bei der DB Systel, einem Tochterunternehmen der Deutschen Bahn. Im Job-Protokoll erzählt sie, wie sie zu ihrem Beruf gekommen ist, wie ihr Arbeitsalltag aussieht und warum KI erzogen werden muss.
Was meine tägliche Arbeit ausmacht:
Die Instandhaltung und Wartung der Züge ist bei der Deutschen Bahn selbstredend ein großes Thema. Hier leiste ich als Data Scientist wichtige Vorarbeiten.
Ich bekomme Bilder und Videos von den Zügen. Mithilfe von KI ist es nun möglich, in kurzer Zeit auf diesen Bildern und Videos mögliche Schäden auszumachen. Wir Data Scientists geben dann den Wagenmeistern den Hinweis, dass an diesem oder jenem Fahrzeug etwas nicht in Ordnung ist. Sie müssen dann noch einmal den jeweiligen Zug inspizieren – denn hundertprozentige Genauigkeit über das Ausmaß der Schäden ist mit KI nicht möglich. Genauigkeiten zwischen 95 bis 99 Prozent sind sehr gute Zielwerte.
KI in sicherheitsrelevanten Bereichen braucht immer Menschen, die die Ergebnisse verifizieren – die Arbeit der Wagenmeister wird aber mit den Analysen erleichtert.
Wie ich meinen Job Leuten erkläre, die von der Materie keine Ahnung haben:
Maschinen sollen automatisiert beispielsweise Schäden oder Schwachstellen von Zügen auf Bildern oder Videos erkennen – ich arbeite daran, diese Maschinen intelligent zu machen. Die KI ist quasi wie ein kleines Kind, das erzogen werden muss. Dafür lege ich der KI Daten zum Trainieren vor. Je mehr davon, desto besser.
Bevor ich mich um dieses Machine Learning kümmere, bereite ich die entsprechenden Daten auf. Das heißt, ich werte etwa Bilder unterschiedlichen Typs aus und markiere, wo genau sich ein Schaden oder eine Schwachstelle befindet.
Nun ist es ja so, dass jedes Bild aus einer Vielzahl von Pixeln besteht – mit verschiedenen Farbwerten und Intensitäten. Die Bilderkennung analysiert diese Merkmale, um visuelle Muster und Strukturen zu erkennen und wandelt sie in digitale Daten um.
Die so gewonnenen Daten bereinige ich – trenne also Wichtiges von Unwichtigem – und ordne sie. Dann analysiere ich den nun bestehenden strukturierten Datenpool mithilfe von mathematischen und statistischen Modellen sowie Machine-Learning-Algorithmen, um Muster zu identifizieren.
Solche Algorithmen müssen auch programmiert werden, was ebenfalls eine Aufgabe von Data Scientists ist. Sobald Muster feststehen, übermittele ich sie nun Maschinen, damit diese künftig automatisiert auf Bildern und Videos ausloten können, wo genau sich Schäden an Zügen befinden.
KI kommt übrigens bei der Deutschen Bahn beispielsweise auch zum Einsatz, um herauszufinden, wann die Auslastung der Züge besonders hoch ist und wann weniger. Die Ergebnisse geben dem Unternehmen eine Entscheidungsgrundlage, ob zu bestimmten Zeiten etwa mehr Züge eingesetzt werden müssen.
Mein Weg in den Job:
Ich habe Physik studiert. Programmieren fand ich schon immer spannend, dahingehende Kenntnisse eignete ich mir während des Studiums an. Vieles, was ich heutzutage in meinem Berufsalltag brauche, habe ich mir zudem über Lernvideos beigebracht.
Es gibt auch noch andere Wege in den Job. Zum Beispiel ein anderer MINT-Studienabschluss. Oder gleich ein Studium in Data Science.
Mein Ding ist die Analyse von Bild- und Videodaten. Aber es gibt in meiner Branche noch viele weitere Spezialisierungen.
Etwa die Analyse von medizinischen Daten, um neue Therapien zu entwickeln. Oder die Analyse von Finanzdaten eines Unternehmens, um dessen Gewinn zu steigern. Oder die Analyse von Kundendaten eines E-Commerce-Unternehmens, um Nutzern passende Inhalte anzuzeigen. Bei Versicherungen sind Data Scientists ebenfalls tätig – dort tragen sie mit ihrer Arbeit etwa zu einer optimierten Risikobewertung und Tarifgestaltung bei.
Die Herausforderungen:
Eine der Herausforderungen besteht darin, die KI richtig zu trainieren, damit Maschinen richtige und möglichst exakte Ergebnisse liefern. Das ist mitunter schwierig. Probleme sind auch wahrscheinlich, wenn der Datenpool nicht ausreichend strukturiert ist, um eine fundierte Analyse machen zu können.
Warum mein Job der schönste von allen für mich ist:
Der Job passt einfach optimal zu meinen Fähigkeiten. Es ist faszinierend zu erleben, was alles mit KI machbar ist und womöglich eines Tages noch machbar sein wird. Es bleibt also spannend.
Die Verdienstmöglichkeiten:
Sie hängen beispielsweise davon ab, in welcher Branche und in welchem Unternehmen man tätig ist.
Die Bundesagentur für Arbeit gibt im Entgeltatlas einen mittleren monatlichen Bruttoverdienst von 5991 Euro für Data Scientists an. Der Median ist der Wert, der genau in der Mitte einer Datenverteilung liegt. Er gibt somit den Wert an, bei dem die Hälfte mehr verdient, die andere Hälfte weniger.