Este projeto foi desenvolvido como parte da mentoria que eu recebo. O objetivo é carregar os dados em nuvem, após serem devidamente tratados, para que estejam acessíveis para ferramentas de BI.
- Tratamento de dados a partir de um dataset no formato
.csv
- Transformação de dados com limpeza, padronização e enriquecimento em SQL, inicialmente em um banco local (Postgres).
- Criação de um DataLake na cloud, com camadas: raw, silver, gold e diamond.
- Consumo dos dados via ferramenta de BI.
- Clone este repositório:
git clone https://github.com/DaviMacielCavalcante/desafio2-prof-artemisia cd desafio2-prof-artemisia
- Baixe o arquivo
indexData.csv
deste linkhttps://www.kaggle.com/datasets/mattiuzc/stock-exchange-data
- Na raiz do projeto, crie um diretório chamado "datasets", e ponha o arquivo
indexData.csv
nele.
- Recomendo limpar os arquivos
.csv
presentes nas camadas do datalake, só para você ter a experiência de ver tudo acontecer ou alterar os scripts da forma que preferir.
- Execute o scrip que é responsável por fazer a criação da camada silver:
python preparando_camada_silver.py
- Em seguida, o da camada gold:
python preparando_camada_gold.py
- Por fim, o da camada diamond:
python preparando_camada_diamond.py
- Subindo para a cloud:
- Crie uma conta na AWS;
- Siga este tutorial na AWS LATAM para subir o datalake:
https://youtube.com/playlist?list=PLQHh55hXC4yrBZ4yookmQPlX2zM9dZ-MH&si=lpGE6Hz2F6t37THw
- Se quiser conectar ao Power BI, siga este tutorial:
https://youtu.be/WS3LUbK0ung?si=YXc_Wy5j53Ct34z3
- Continue no caminho legal da força:
Contribuições são bem-vindas! Por favor, siga estas diretrizes:
- Faça um fork do projeto.
- Crie uma branch para a funcionalidade que deseja implementar (git checkout -b minha-nova-feature).
- Faça os commits com boas descrições (git commit -m 'Adiciona nova feature').
- Faça um push para a branch criada (git push origin minha-nova-feature).
- Abra um pull request para revisão.
Este projeto está licenciado sob a licença MIT - veja o arquivo LICENSE.md para mais detalhes.
Se você tiver alguma dúvida ou problema, entre em contato:
e-mail: [email protected]
- Darth Davi ⚔️😡
Github da mentora: https://github.com/arteweyl
Through victory, my chains are broken.
The Force shall free me.