Stellenangebot
Sr Implementation Lead, SRE (CoP)
Der Sr Implementation Lead, SRE (CoP) ist für die strategische Implementierung von SRE-Frameworks und die Entwicklung von Standards, Prozessen und Governance-Modellen verantwortlich, um die betriebliche Resilienz zu fördern. Der Kandidat sollte über 10 Jahre Erfahrung in SRE, DevOps oder ähnlichen Bereichen verfügen und ausgezeichnete Kommunikations- und Führungsqualitäten besitzen.
Stellenbeschreibung
Schlüsselaufgaben
- Führen Sie die strategische Implementierung von SRE-Frameworks durch, indem Sie globale Best Practices und Geschäftsziele aufeinander abstimmen.
- Entwickeln und durchsetzen Sie SRE-Standards, -Prozesse und -Governance-Modelle, um die betriebliche Resilienz zu fördern.
- Definieren und ermöglichen Sie SREs, wichtige Zuverlässigkeitsmetriken (SLOs, SLIs, Fehlerbudgets) über kritische Anwendungen und Infrastrukturen hinweg zu verfolgen.
Gemeinschaftsaufbau und Wissensaustausch
- Etablieren und pflegen Sie eine starke SRE-Community of Practice, um den Wissensaustausch und das gemeinsame Lernen zu fördern.
- Organisieren Sie technische Foren, Workshops und Schulungsprogramme, um die SRE-Fähigkeiten über die Engineering-Teams hinweg zu verbessern.
- Agieren Sie als Mentor und Berater für SRE-Teams, um eine kontinuierliche Verbesserung der Site-Reliability-Praktiken zu ermöglichen.
Automatisierung und Tooling-Enablement
- Fördern Sie die Einführung von Automatisierungsansätzen für Incident Response, Kapazitätsplanung und Release-Engineering.
- Arbeiten Sie mit Plattform-Engineering-Teams zusammen, um die Standardisierung von Observability, Chaos-Engineering und Selbstheilungsmechanismen voranzutreiben.
- Identifizieren und implementieren Sie branchenführende SRE-Tools und -Technologien, um die Systemresilienz zu verbessern.
Zusammenarbeit und funktionsübergreifendes Engagement
- Arbeiten Sie eng mit Engineering-, Operations-, Risiko- und Compliance-Teams zusammen, um SRE-Prinzipien in SDLC- und IT&SM-Prozesse einzubetten.
- Agieren Sie als Brücke zwischen Führung und technischen Teams, indem Sie strategische Ziele in umsetzbare SRE-Initiativen übersetzen.
- Setzen Sie sich für eine Kultur der Zuverlässigkeit, blameless Postmortems und kontinuierlichen Lernens über das Unternehmen hinweg ein.
Anforderungen und Erfahrungen
- 10+ Jahre Erfahrung in SRE-, DevOps-, Plattform-Engineering- oder Software-Reliability-Engineering-Rollen.
- Starkes Verständnis von SRE-Prinzipien, cloud-nativen Architekturen, modernen Hybrid-Architekturen und Observability-Praktiken.
- Technische Expertise mit Automatisierung, CI/CD-Pipelines, Überwachungstools (Dynatrace, Prometheus, Splunk, Azure Monitor) und Incident-Management-Frameworks.
- Erwiesene Fähigkeit, Communities of Practice in großen Unternehmen aufzubauen und zu führen.
- Ausgezeichnete Kommunikations-, Führungs- und Stakeholder-Management-Fähigkeiten.
Wir bieten
- Gehaltsspanne: $164.600 - $288.000 USD.
- Umfassendes Benefits-Paket, einschließlich Rentenleistungen (401(k) und Pension), Gesundheits- und Sozialleistungen (Krankenversicherung, Zahnversicherung, Sehversicherung, Ausgabenkonten und Behinderungsversicherung), bezahlter Urlaub, Eltern- und Pflegeurlaub, Lebens- und Unfallversicherung sowie andere freiwillige und Wellness-Leistungen.
- Diskretionäres Bonusprogramm, das eine Eigenkapitalkomponente enthalten kann.
Arbeitsumfeld
- Flexible und kollaborative Arbeitskultur.
- Organisation, die sich für die Unterstützung der Gemeinschaften einsetzt.
Jobdetails