الصفحة الرئيسية البرازيل Site reliability engineer sre pleno

الصفحة الرئيسية البرازيل Site reliability engineer sre pleno

Site reliability engineer sre pleno

دوام كامل في NetVagas في Brasil
نُشرت يوم February 11, 2025

تفاصيل الوظيفة

Sobre a Tec2Cloud Somos uma Consultoria de Tecnologia parceiros SAP e AWS. O nosso clima e jeito de trabalhar são guiados pelos nossos valores: paixão por pensar, tecnologia e gente, foco no cliente, empatia, dedicação e respeito! Estamos à procura de um SRE Pleno para compor o time do nosso cliente, uma empresa multinacional Belga. Você desempenhará um papel crucial na manutenção da confiabilidade, escalabilidade e desempenho de nossos sistemas. Atividades: Demonstrar fortes habilidades de resolução de problemas para diagnosticar e resolver problemas técnicos complexos com eficiência. Colaborar com equipes multifuncionais para identificar e resolver as causas raízes dos problemas do sistema. Compreender e aplicar princípios de arquitetura de sistema para projetar e implantar sistemas escalonáveis, confiáveis e tolerantes a falhas. Contribuir para o projeto e implementação de melhorias de infraestrutura para melhorar o desempenho do sistema. Possuir familiaridade com plataformas em nuvem como Azure, AWS ou Google Cloud. Conhecimento e compreensão da implantação e gerenciamento de recursos em nuvem com confiabilidade, escalabilidade e segurança. Compreensão ou experiência com orquestração Docker e Kubernetes. Implementar scripts e ferramentas de automação para agilizar tarefas repetitivas, garantindo eficiência operacional. Colaborar com equipes de desenvolvimento para integrar a automação aos pipelines de CI/CD e agilizar o processo de lançamento, com foco nos princípios de DevOps. Utilizar ferramentas de monitoramento para monitorar o desempenho do sistema e dos aplicativos, fornecer insights para aprimorar a observabilidade da solução, configurar alertas e analisar métricas. Identificar proativamente possíveis problemas e implementar soluções de monitoramento para garantir a confiabilidade do sistema. Compreender os procedimentos de resposta e gerenciamento de incidentes, incluindo a participação em rodízios de plantão. Contribuir para a resolução de incidentes, escalonamento e análise pós-incidente (Análise de causa raiz/post-mortem sem culpa) para prevenir ocorrências futuras. Assumir a responsabilidade pelos projetos atribuídos, conduzindo-os desde o início até a conclusão. Trabalhar de forma independente e colaborativa para fornecer soluções de alta qualidade dentro de prazos especificados. Requisitos: Forte capacidade analítica e de resolução de problemas. Compreensão dos princípios da arquitetura do sistema. Familiaridade com plataformas em nuvem (Azure, AWS ou Google Cloud) e sua CLI. Familiaridade com plataformas e ferramentas DevOps (Azure DevOps, GitHub, Jenkins). Experiência com ferramentas de monitoramento (Datadog, Prometheus, Dynatrace, Splunk). Conhecimento de procedimentos de resposta e gerenciamento de incidentes. Boas habilidades de comunicação em inglês, tanto escrita quanto verbal. Graduação em Ciência da Computação, Tecnologia da Informação ou áreas afins. Diferenciais: Certificações em nuvem (Az-900, Az-104, AWS ou equivalentes GCP). Certificação CKA ou CKAD. Certificação DevOps ou SRE Foundations ou Practitioner. Contratação no modelo PJ. Modelo 100% Remoto. #J-18808-Ljbffr

Apply safely

To stay safe in your job search, information on common scams and to get free expert advice, we recommend that you visit SAFERjobs, a non-profit, joint industry and law enforcement organization working to combat job scams.

Share this job
See All Site Jobs
تعليقات وملاحظات تعليقات وملاحظات