Stellenangebot
Senior Data Engineer 100% (f/m/d)
Wir suchen einen Senior Data Engineer, der die Entwicklung eines Python-basierten Unternehmens-Datenhubs unterstützt und die MLOps-Infrastruktur vorantreibt. Die Rolle kombiniert DevOps-Exzellenz mit hands-on Machine-Learning-Engineering, um skalierbare, zuverlässige und auditable ML-Lösungen zu liefern.
Aufgaben
- Unterstützung bei der Entwicklung eines Python-basierten Unternehmensdaten-Hubs (integriert mit Oracle) und Weiterentwicklung der MLOps-Infrastruktur
- Kombination von DevOps-Exzellenz mit hands-on Machine-Learning-Engineering, um skalierbare, zuverlässige und auditable ML-Lösungen bereitzustellen
- Automatisierung von CI/CD-Pipelines für Daten- und ML-Workloads, Beschleunigung der Modellbereitstellung, Gewährleistung der Systemstabilität, Durchsetzung von Infrastructure-as-Code und ML
- Entwicklung, Training und Evaluierung von Machine-Learning-Modellen (z.B. mit scikit-learn, xgboost, PyTorch) in enger Zusammenarbeit mit Data Scientists
- Orchestrierung von End-to-End-ML-Workflows, einschließlich Vorverarbeitung, Training, Hyperparameter-Tuning und Modellvalidierung
- Bereitstellung und Betrieb von Modellen in der Produktion unter Verwendung von containerisierten Microservices (Docker/K8s) und REST/gRPC-APIs
- Verwaltung des MLOps-Lebenszyklus über Tools wie MLflow (Experiment-Tracking, Modell-Register) und Implementierung von Überwachung für Drift, Degradation und Leistung
- Refaktorisierung von exploratorischem Code (z.B. Jupyter-Notebooks) in robuste, testbare und versionierte Produktionspipelines
- Zusammenarbeit mit Data Engineers zur Bereitstellung und Optimierung des Datenhubs, um zuverlässige Datenflüsse für Training und Inferenz zu gewährleisten
- Fehlerbehebung von Betriebsproblemen über Infrastruktur-, Daten- und Modellschichten; Teilnahme an Incident-Response und Root-Cause-Analyse
Anforderungen
- Technische Kompetenz: Starke Fähigkeiten in Python, Linux, CI/CD, Docker, Kubernetes und MLOps-Tools (z.B. MLflow)
- Praktische Erfahrung mit Oracle-Datenbanken, SQL und ML-Frameworks
- ML-Engineering-Fähigkeit: Fähigkeit, den gesamten ML-Lebenszyklus zu besitzen – von Training und Evaluierung bis hin zur Bereitstellung und Überwachung – mit besonderer Aufmerksamkeit für Reproduzierbarkeit und Compliance
- Automatisierung und Zuverlässigkeit: Verpflichtung zum Aufbau stabiler, selbstheilender Systeme mit proaktiver Überwachung und automatischer Wiederherstellung
- Zusammenarbeit und Kommunikation: Effektiver Teamplayer in agilen, cross-funktionalen Umgebungen; in der Lage, klar über technische und nicht-technische Zielgruppen zu kommunizieren
Bildung und Fähigkeiten
- Ausbildung: Bachelor of Science (BS) in Informatik, Ingenieurwesen, Data Science oder einem verwandten Feld
- Zertifizierungen wie CKA, AWS/Azure DevOps Engineer oder Google Cloud Professional DevOps Engineer sind von Vorteil
- Technische Fähigkeiten: Proficient in Python, Git und Shell-Skripting
- Erfahrung mit CI/CD-Pipelines (GitLab, Jenkins), Docker und Kubernetes
Wir bieten
Keine Informationen vorhandenJobdetails