Data Lake com Spark

Pipeline em PySpark com camadas Bronze, Silver e Gold

⬅ Voltar

Descrição do Projeto

Este projeto simula um fluxo completo de ingestão e transformação de dados em um Data Lake utilizando PySpark. Os dados são particionados e organizados em camadas: Bronze (raw), Silver (curated) e Gold (analytics).

Stack Utilizada

Capturas de Tela

Partições Spark Saída PySpark