Offerta di lavoro

Ingegnere affidabilità sito

Il ruolo di Site Reliability Engineer presso Man Group consiste nel garantire l'affidabilità, la disponibilità e le prestazioni delle tecnologie che supportano gli hedge fund e gli altri progetti dell'azienda. L'SRE si concentrerà sullo sviluppo di soluzioni volte ad accelerare la diagnosi e la risoluzione degli incidenti, l'osservabilità, la pianificazione della capacità e l'automazione.

Il ruolo

Entra a far parte del nostro team di Site Reliability Engineering (SRE) ad alte prestazioni e ricopri un ruolo fondamentale nel garantire l'affidabilità, la disponibilità e le prestazioni della tecnologia che sta alla base degli hedge fund di Man AHL, di AHL e di altri progetti Edge-Impact. Si tratta di un'opportunità per lavorare con tecnologie all'avanguardia e acquisire una comprensione più approfondita sia della tecnologia che del business.

Responsabilità del ruolo

* Garantire l'affidabilità e le prestazioni dei sistemi critici nell'intera infrastruttura globale, attraverso un monitoraggio proattivo e una risposta rapida agli incidenti. * Sviluppare e implementare soluzioni di osservabilità con strumenti quali Prometheus, Datadog, ELK e Loki, al fine di fornire metriche significative. * Crea e gestisci SLA, SLO, SLI e budget di errore per guidare i miglioramenti dell'affidabilità e definire le priorità di progettazione. * Automatizza le attività operative e sviluppa funzionalità self-service per eliminare le attività di routine e migliorare l'efficienza. * Partecipa ai turni di reperibilità, gestisci i processi di reperibilità, esegui analisi post-mortem, implementa misure preventive per evitare interruzioni e partecipa alle attività di risposta. * Collabora con i team di sviluppo per migliorare la progettazione dei sistemi, le pratiche di distribuzione e l'eccellenza operativa. * Configurare e distribuire i costi del cloud, gestire lo storage bare-metal, grandi implementazioni di CPU/GPU e sistemi di distribuzione ad alte prestazioni. * Contribuire alla pianificazione della capacità e al budgeting delle prestazioni per garantire che i sistemi soddisfino i requisiti aziendali. * Gestisci diversi cluster ELK contenenti centinaia di terabyte di dati di log, telemetria e APM.

Competenze chiave

Richiesto

* Buona comprensione dei principi SRE, inclusi SLI, SLO, budget di errore e test di affidabilità. * Oltre 5 anni di esperienza e risultati comprovati nella gestione di diversi progetti IT. * Conoscenza degli strumenti di automazione (Ansible, Terraform) e dei linguaggi di scripting/programmazione (Python, Go, Powershell). * Ottime capacità di individuazione e risoluzione dei problemi in sistemi distribuiti, con la capacità di diagnosticare problemi di produzione complessi sotto pressione. * Esperienza con visualizzazione, monitoraggio, turni di reperibilità e revisioni post-incidente. * Familiarità con Kubernetes e l'orchestrazione dei container.

Vantaggioso

* Esperienza con pipeline CI/CD e flussi di lavoro del codice sorgente (Git, Jenkins, TeamCity/Azure). * Amministrazione di sistemi Linux e Windows ed esperienza con tecnologie cloud (AWS/Azure). * Comprensione dei concetti di rete, del bilanciamento del carico e delle architetture distribuite. * Conoscenza di A/UX e/o ottimizzazione delle prestazioni dell'infrastruttura, server HPE. * Familiarità con i principi FinOps, desiderio di comprendere i costi reali delle nostre decisioni. * Competenze dimostrabili nella comunicazione scritta e orale e nella collaborazione.

Vantaggi

* Spazi di lavoro moderni nel campus di Old Broadwick, con facile accesso ai mezzi di trasporto e ai servizi * Modello di lavoro ibrido * Pacchetto ferie di 28 giorni * Indennità ferie di 21 giorni * Assicurazione premium contro infortuni e decesso * Programma di sostegno ai dipendenti * Operatori di primo soccorso per la salute mentale * Premio di segnalazione * Giorni di malattia aggiuntivi per anzianità di servizio e

Dettagli sul lavoro

© 2025 House of Skills by skillaware. Tutti i diritti riservati.
Il nostro sito web utilizza i cookie per facilitarvi la navigazione e per analizzare l'utilizzo del sito. Per ulteriori informazioni, consultare la nostra informativa sulla privacy.