Última atualização: 19 de Dezembro de 2025
Sobre
Descritivo da vaga
Buscamos um(a) Engenheiro(a) de Dados Sênior para atuar em uma arquitetura moderna de dados na OCI (Oracle Cloud Infrastructure), com ingestão near–real time e processamento distribuído em PySpark. O papel envolve construir e evoluir pipelines robustos, garantir qualidade das camadas do modelo medalhão (Bronze → Platinum) e disponibilizar dados para consumo via MySQL HeatWave e Metabase.
Responsabilidades
- Desenvolver e otimizar pipelines em PySpark (Bronze/Silver/Gold/Platinum).
- Ingestão via EventHub, flat files e MongoDB (API).
- Operar arquitetura Lakehouse em OCI (buckets, HeatWave, external tables).
- Criar e manter DAGs no Airflow.
- Automatizar processos com GitHub + GitHub Actions.
- Implementar integrações e exports com Python + Metabase API.
- Garantir padrões de qualidade, observabilidade e performance.
Requisitos
- Domínio avançado em PySpark , Python e SQL
- Domínio avançado em Modelagem de dados
- Domínio de Data Lake / Delta Lake
- Experiência com arquitetura medalhão e pipelines near–real time.
- Experiência com Airflow e Git/GitHub Actions.
- Experiência em infraestrutura em cloud (AWS, GCP, Azure, OCI...)
Desejáveis
- Conhecimento na Cloud OCI (Dataflow, buckets, HeatWave, external tables).
- Governança de dados
- Observabilidade
Outras Informações
Benefícios
30 dias de férias remuneradas após 1 ano de contrato.
Etapas do processo
Entrevista técnica
Case
Entrevista com RH + Time de engenharia de dados
Entrevista com CTO
Hey!
Cadastre-se na Remotar para ter acesso a todos os recursos da plataforma, inclusive inscrever-se em vagas exclusivas e selecionadas!