Data Engineer developing and maintaining robust data pipelines using PySpark and Airflow at Logcomex. Collaborating with product teams to ensure data quality and governance.
Responsibilities
Desenvolver e manter pipelines de dados robustos, escaláveis e testáveis utilizando PySpark e Airflow.
Projetar e implementar processos de ingestão e transformação de dados para alimentar o datalake em arquitetura de camadas (Bronze, Silver, Gold).
Atuar com controle de qualidade de dados, documentação e gestão de linhagem utilizando OpenMetadata.
Trabalhar em conjunto com os squads de produto e captura para garantir a consistência e cobertura dos dados.
Garantir a governança de dados, versionamento e auditoria das pipelines em produção.
Otimizar rotinas de ETL/ELT e desempenho de queries em bancos relacionais, data warehouses e motores como Elasticsearch e Athena.
Requirements
Procuramos pessoas com conhecimento em...
PySpark
Apache Airflow
AWS S3, Glue, Athena, EC2
SQL (Athena, PostgreSQL)
Elasticsearch/OpenSearch
Docker
Pandas
Jupyter
Unix (Linux), Bash
DBT
Será legal se você conhecer...
Glue
Delta Lake
Kubernetes
NoSQL
Elasticsearch
Airbyte
Benefits
Benefícios Caju no valor fixo de R$2.300,00 mês (CWB e RMC) ou R$ 1.840,00 (Demais regiões) (alimentação, mobilidade, saldo multi e auxílio home office);
Plano de saúde Unimed ou Amil com abrangência Nacional;
Plano odontológico Odontoprev;
Seguro de vida - Metlife;
Wellhub;
Keikein (plataforma de apoio psicológico);
Convênio farmácia Panvel;
Licença maternidade e paternidade estendida pelo Programa Empresa Cidadã;
Subsídio para desenvolvimento, em parceria com a Unico Skill, que oferece diversas opções de graduação, pós-graduação, idiomas, mentorias, etc;
Aulas de inglês particulares para liderança e especs nível II para cima;
Auxilio Escola/Educação.
Frutas frescas, cookies, café, chá e energéticos disponíveis a qualquer momento;
Happy hours, eventos de integração e team buildings;
Viagens para o escritório dos Loggers de fora são custeadas pela empresa;
Sem dress code: aqui você pode ser você e usar o que te deixa mais confortável;
Ambiente descontraído, cheio de desafios e campeonatos de videogame; Rede de descanso para um respiro no meio da correria do dia
Biblioteca da Log com livros incríveis para todos os Loggers se desenvolverem;
Massagem in company;
Day-off de aniversário;
Presente de aniversário;
Presentes incríveis a cada ano de Logger;
Recruta Loggers (programa de indicação com bonificação $).
Data Warehouse Modelling Engineer designing and maintaining data models using Data Vault 2.0 for iGaming industry. Collaborating with stakeholders and optimizing data models in a hybrid work environment.
Senior Data Engineer driving impactful data solutions for the climate logistics startup HIVED's core data platform. Collaborating with cross - functional squads to enhance analytics and delivery.
Data Engineer developing and maintaining CRE forecasting infrastructure for Cushman & Wakefield. Collaborates with senior economists and technical teams to ensure high - quality data solutions.
Data Engineer at PwC, engaging with Azure cloud services to enhance data handling and integrity. Responsibilities include pipeline optimizations, documentation, and collaboration with stakeholders.
Data Engineer Manager at PwC focusing on building data infrastructure and solutions. Leading data engineering projects to transform raw data into actionable insights and drive business growth.
Junior Data Engineer at OneMarketData focusing on data quality and integrity in financial datasets. Collaborating with senior analysts and assisting in data management and analysis tasks.
Senior Data Engineering Analyst developing and implementing data solutions. Collaborating in a diverse environment focused on data processing and analysis for clients' digital transformation.