116 - Analista de Observabilidade Sênior/Especialista
DEVELCODE INFORMATICA LTDACaxias do Sul - RS
1 posição
Não informado
Integral
Muito prazer, nós somos as pessoas da Develcode!
Somos uma empresa de tecnologia com mais de uma década de história, reconhecida como GPTW (Great Place to Work), e movida por um propósito: entregar soluções de software inovadoras que transformam negócios e pessoas.
Aqui, valorizamos a inovação, a colaboração e o comprometimento, cultivando um ambiente de trabalho seguro, desafiador e humano, que incentiva o crescimento contínuo dos nossos colaboradores e valoriza a autenticidade de cada pessoa.
Nossa equipe é formada por profissionais altamente qualificados, distribuídos por todo o Brasil, e nossa matriz está localizada em Caxias do Sul - RS.
Acreditamos que tecnologia e pessoas caminham juntas, e é por isso que investimos em aprendizado, bem-estar e propósito.
Venha construir o futuro com a gente!
O que buscamos?
Estamos em busca de um Analista de Observabilidade Sênior/Especialista para atuar em um grande cliente.
Principais Responsabilidades:
- Implantar e evoluir a plataforma de observabilidade com Datadog como ferramenta principal (APM, logs, métricas e traces).
- Definir padrões de instrumentação e apoiar times na adoção (bibliotecas, agentes e integrações).
- Criar e manter dashboards, monitores e alertas (com foco em alertas acionáveis e redução de falsos positivos).
- Apoiar e executar práticas relacionadas a confiabilidade: gestão de incidentes, runbooks, pós incidente e ações de melhoria contínua.
- Definir e acompanhar SLI/SLO para serviços críticos, alinhando alertas ao impacto no usuário.
- Integrar e operar observabilidade também com Azure Appliction Insights (desejável) e AWS CloudWatch (desejável).
- Trabalhar em parceria com times de desenvolvimento, infraestrutura e segurança para melhoria cotínua da qualidade operacional.
Requisitos:
- Datadog (principal): configuração e operação de monitores, alertas, dashboards e integrações.
- Experiência com práticas de SRE, incluindo resposta a incidentes e gestão de incidentes.
- Conhecimento e aplicação prática de SLI/SLO.
- Experiência com Azure e AWS; OCI desejável.
Diferenciais:
- Experiência com Azure Application Insights.
- Experiência com AWS CloudWatch.
- Experiência com Kubernetes/microserviços e ambientes distribuídos.
- Experiência com automação/IaC para padronizar configurações de observabilidade (monitores/dashboards como código).
Soft Skills:
- Comunicação clara, inclusive em cenários de incidente e pressão.
- Organização e senso de prioridade orientado a impacto.
- Capacidade analí ca para diagnós co e correlação de sintomas (métricas/logs/traces).
- Colaboração com mes mul disciplinares (dev, infra, produto e segurança).
Se você busca um lugar para crescer e inovar, seu próximo passo é aqui!
Requisitos
Habilidade Técnica
- AWS - Avançado
- SRE - Avançado
- Azure Devops - Avançado
- Datadog - Avançado