DevOps SRE managing system reliability and performance in a hybrid work environment. Collaborating with development and infrastructure teams at the GFT company in Brazil.
Responsibilities
Garantir a confiabilidade, disponibilidade e performance das aplicações em produção;
Definir, monitorar e evoluir SLA, SLO e SLI;
Implementar e manter práticas de observabilidade (métricas, logs, tracing e alertas);
Desenvolver automações para redução de toil e aumento da eficiência operacional;
Atuar na gestão de incidentes, análise de causa raiz e elaboração de post-mortems;
Colaborar com times de desenvolvimento, DevOps e infraestrutura;
Contribuir para melhorias de segurança, resiliência e compliance;
Apoiar iniciativas de FinOps para otimização de custos em cloud;
Promover boas práticas de SRE e DevOps dentro dos squads.
Requirements
Experiência em ambientes on-premises e cloud (preferencialmente AWS);
Sólido conhecimento em observabilidade (Prometheus, Grafana, Dynatrace, Datadog, OpenTelemetry);
Experiência com automação e scripting (Python, Go, Bash e/ou PowerShell);
Conhecimento em Linux e Windows;
Experiência com Docker e Kubernetes;
Vivência com práticas SRE (error budgets, redução de toil, post-mortems);
Experiência com monitoramento, alertas e dashboards;
Conhecimento em redes, segurança e troubleshooting avançado;
Graduação em Ciência da Computação, Engenharia ou áreas correlatas.
Certificações AWS, Observabilidade ou Kubernetes;
Experiência com CI/CD (GitLab, GitHub Actions, Jenkins);
Vivência com IaC (Terraform, CloudFormation);
Conhecimento em arquiteturas distribuídas e microserviços.;
Experiência com FinOps;
Familiaridade com SRE avançado (Chaos Engineering, Fault Injection).
Benefits
Cartão multi-benefícios – você escolhe como e onde utilizar.
Bolsas de Estudos para cursos de Graduação, Pós, MBA e Idiomas.
Programas de incentivo à Certificações.
Horário de trabalho flexível.
Salários competitivos.
Avaliação de desempenho anual com plano de carreira estruturado.
DevOps Team Lead at Insightful managing DevOps engineers for optimizing cloud infrastructure and CI/CD processes. Focused on team mentoring and operational excellence in a collaborative environment.
Site Reliability Engineer ensuring the reliability and performance of Freewheel systems. Collaborating across teams to optimize infrastructure and automate operations.
DevOps Professional specializing in Salesforce release management at YASH Technologies. Involves CI/CD pipeline management, version control, and collaboration with development teams.
Instrument/Control SIS Reliability Engineer providing technical support for BASF's global engineering team. Delivering complex engineering solutions and ensuring adherence to technical standards and safety regulations across multiple projects.
Site Reliability Engineer working on Linux systems for observability platforms and logging. Design and maintain applications, support network visibility, and collaborate with teams.
DevOps Engineer working at White Circle, focusing on infrastructure for AI systems. Involves managing production environments, Kubernetes, CI/CD pipelines, and automation tools.
Airflow Reliability Engineer on the Customer Reliability Engineering team at Astronomer. Working with clients on optimizing their use of the managed Airflow service in a hybrid role in Hyderabad.
Full - Stack Engineer enhancing engineering productivity at Fidelity. Building internal tools for SRE teams to improve operational efficiency and reliability.
DevOps Engineer at Cloudogu working with development and operations for reliable software delivery. Focusing on CI/CD, infrastructure automation, and platform services in an agile environment.
Jr. DevOps Engineer supporting and improving CI/CD pipelines and Linux systems at Swift. Collaborating with senior engineers in a hands - on learning environment.