Job offer
Sr Implementation Lead, SRE (CoP)
The Sr Implementation Lead, SRE (CoP) is responsible for the strategic implementation of SRE frameworks and the development of standards, processes and governance models to drive operational resilience. The candidate should have 10 years of experience in SRE, DevOps or similar areas and have excellent communication and leadership skills.
Job description
Key tasks
- Führen Sie die strategische Implementierung von SRE-Frameworks durch, indem Sie globale Best Practices und Geschäftsziele aufeinander abstimmen.
- Entwickeln und durchsetzen Sie SRE-Standards, -Prozesse und -Governance-Modelle, um die betriebliche Resilienz zu fördern.
- Definieren und ermöglichen Sie SREs, wichtige Zuverlässigkeitsmetriken (SLOs, SLIs, Fehlerbudgets) über kritische Anwendungen und Infrastrukturen hinweg zu verfolgen.
Gemeinschaftsaufbau und Wissensaustausch
- Etablieren und pflegen Sie eine starke SRE-Community of Practice, um den Wissensaustausch und das gemeinsame Lernen zu fördern.
- Organisieren Sie technische Foren, Workshops und Schulungsprogramme, um die SRE-Fähigkeiten über die Engineering-Teams hinweg zu verbessern.
- Agieren Sie als Mentor und Berater für SRE-Teams, um eine kontinuierliche Verbesserung der Site-Reliability-Praktiken zu ermöglichen.
Automatisierung und Tooling-Enablement
- Fördern Sie die Einführung von Automatisierungsansätzen für Incident Response, Kapazitätsplanung und Release-Engineering.
- Arbeiten Sie mit Plattform-Engineering-Teams zusammen, um die Standardisierung von Observability, Chaos-Engineering und Selbstheilungsmechanismen voranzutreiben.
- Identifizieren und implementieren Sie branchenführende SRE-Tools und -Technologien, um die Systemresilienz zu verbessern.
Zusammenarbeit und funktionsübergreifendes Engagement
- Arbeiten Sie eng mit Engineering-, Operations-, Risiko- und Compliance-Teams zusammen, um SRE-Prinzipien in SDLC- und IT&SM-Prozesse einzubetten.
- Agieren Sie als Brücke zwischen Führung und technischen Teams, indem Sie strategische Ziele in umsetzbare SRE-Initiativen übersetzen.
- Setzen Sie sich für eine Kultur der Zuverlässigkeit, blameless Postmortems und kontinuierlichen Lernens über das Unternehmen hinweg ein.
Anforderungen und Erfahrungen
- 10+ Jahre Erfahrung in SRE-, DevOps-, Plattform-Engineering- oder Software-Reliability-Engineering-Rollen.
- Starkes Verständnis von SRE-Prinzipien, cloud-nativen Architekturen, modernen Hybrid-Architekturen und Observability-Praktiken.
- Technische Expertise mit Automatisierung, CI/CD-Pipelines, Überwachungstools (Dynatrace, Prometheus, Splunk, Azure Monitor) und Incident-Management-Frameworks.
- Erwiesene Fähigkeit, Communities of Practice in großen Unternehmen aufzubauen und zu führen.
- Ausgezeichnete Kommunikations-, Führungs- und Stakeholder-Management-Fähigkeiten.
We offer
- Gehaltsspanne: $164.600 - $288.000 USD.
- Umfassendes Benefits-Paket, einschließlich Rentenleistungen (401(k) und Pension), Gesundheits- und Sozialleistungen (Krankenversicherung, Zahnversicherung, Sehversicherung, Ausgabenkonten und Behinderungsversicherung), bezahlter Urlaub, Eltern- und Pflegeurlaub, Lebens- und Unfallversicherung sowie andere freiwillige und Wellness-Leistungen.
- Discretionary bonus program that may include an equity component.
Working environment
- Flexible and collaborative working culture.
- Organisation, die sich für die Unterstützung der Gemeinschaften einsetzt.
Job details