Site reliability engineer sre pleno
تفاصيل الوظيفة
Sobre a Tec2Cloud Somos uma Consultoria de Tecnologia parceiros SAP e AWS. O nosso clima e jeito de trabalhar são guiados pelos nossos valores: paixão por pensar, tecnologia e gente, foco no cliente, empatia, dedicação e respeito! Estamos à procura de um SRE Pleno para compor o time do nosso cliente, uma empresa multinacional Belga. Você desempenhará um papel crucial na manutenção da confiabilidade, escalabilidade e desempenho de nossos sistemas. Atividades: Demonstrar fortes habilidades de resolução de problemas para diagnosticar e resolver problemas técnicos complexos com eficiência. Colaborar com equipes multifuncionais para identificar e resolver as causas raízes dos problemas do sistema. Compreender e aplicar princípios de arquitetura de sistema para projetar e implantar sistemas escalonáveis, confiáveis e tolerantes a falhas. Contribuir para o projeto e implementação de melhorias de infraestrutura para melhorar o desempenho do sistema. Possuir familiaridade com plataformas em nuvem como Azure, AWS ou Google Cloud. Conhecimento e compreensão da implantação e gerenciamento de recursos em nuvem com confiabilidade, escalabilidade e segurança. Compreensão ou experiência com orquestração Docker e Kubernetes. Implementar scripts e ferramentas de automação para agilizar tarefas repetitivas, garantindo eficiência operacional. Colaborar com equipes de desenvolvimento para integrar a automação aos pipelines de CI/CD e agilizar o processo de lançamento, com foco nos princípios de DevOps. Utilizar ferramentas de monitoramento para monitorar o desempenho do sistema e dos aplicativos, fornecer insights para aprimorar a observabilidade da solução, configurar alertas e analisar métricas. Identificar proativamente possíveis problemas e implementar soluções de monitoramento para garantir a confiabilidade do sistema. Compreender os procedimentos de resposta e gerenciamento de incidentes, incluindo a participação em rodízios de plantão. Contribuir para a resolução de incidentes, escalonamento e análise pós-incidente (Análise de causa raiz/post-mortem sem culpa) para prevenir ocorrências futuras. Assumir a responsabilidade pelos projetos atribuídos, conduzindo-os desde o início até a conclusão. Trabalhar de forma independente e colaborativa para fornecer soluções de alta qualidade dentro de prazos especificados. Requisitos: Forte capacidade analítica e de resolução de problemas. Compreensão dos princípios da arquitetura do sistema. Familiaridade com plataformas em nuvem (Azure, AWS ou Google Cloud) e sua CLI. Familiaridade com plataformas e ferramentas DevOps (Azure DevOps, GitHub, Jenkins). Experiência com ferramentas de monitoramento (Datadog, Prometheus, Dynatrace, Splunk). Conhecimento de procedimentos de resposta e gerenciamento de incidentes. Boas habilidades de comunicação em inglês, tanto escrita quanto verbal. Graduação em Ciência da Computação, Tecnologia da Informação ou áreas afins. Diferenciais: Certificações em nuvem (Az-900, Az-104, AWS ou equivalentes GCP). Certificação CKA ou CKAD. Certificação DevOps ou SRE Foundations ou Practitioner. Contratação no modelo PJ. Modelo 100% Remoto. #J-18808-Ljbffr
Apply safely
To stay safe in your job search, information on common scams and to get free expert advice, we recommend that you visit SAFERjobs, a non-profit, joint industry and law enforcement organization working to combat job scams.