Skip to content

🚀 Desafio ETL: Um projeto prático para explorar conceitos de ETL e criação de Data Lakes em nuvem! Ideal para quem deseja entender como extrair, transformar e carregar dados em um ambiente escalável e integrá-los com ferramentas de BI para visualização e análise!

License

Notifications You must be signed in to change notification settings

DaviMacielCavalcante/desafio2-prof-artemisia

Repository files navigation

desafio2-prof-artemisia

Licença usada Python Status Banco de Dados Cloud_AWS

Descrição:

Este projeto foi desenvolvido como parte da mentoria que eu recebo. O objetivo é carregar os dados em nuvem, após serem devidamente tratados, para que estejam acessíveis para ferramentas de BI.

Funcionalidades:

  • Tratamento de dados a partir de um dataset no formato .csv
  • Transformação de dados com limpeza, padronização e enriquecimento em SQL, inicialmente em um banco local (Postgres).
  • Criação de um DataLake na cloud, com camadas: raw, silver, gold e diamond.
  • Consumo dos dados via ferramenta de BI.

Instalação:

  1. Clone este repositório:
    git clone https://github.com/DaviMacielCavalcante/desafio2-prof-artemisia
    cd desafio2-prof-artemisia
  2. Baixe o arquivo indexData.csv deste link https://www.kaggle.com/datasets/mattiuzc/stock-exchange-data
  3. Na raiz do projeto, crie um diretório chamado "datasets", e ponha o arquivo indexData.csv nele.
  • Recomendo limpar os arquivos .csv presentes nas camadas do datalake, só para você ter a experiência de ver tudo acontecer ou alterar os scripts da forma que preferir.
  1. Execute o scrip que é responsável por fazer a criação da camada silver:
    python preparando_camada_silver.py
  2. Em seguida, o da camada gold:
 python preparando_camada_gold.py
  1. Por fim, o da camada diamond:
 python preparando_camada_diamond.py
  1. Subindo para a cloud:
    • Crie uma conta na AWS;
    • Siga este tutorial na AWS LATAM para subir o datalake:
    https://youtube.com/playlist?list=PLQHh55hXC4yrBZ4yookmQPlX2zM9dZ-MH&si=lpGE6Hz2F6t37THw
    • Se quiser conectar ao Power BI, siga este tutorial:
     https://youtu.be/WS3LUbK0ung?si=YXc_Wy5j53Ct34z3
  2. Continue no caminho legal da força:
darth_vader_local_nevando

Como contribuir:

Contribuições são bem-vindas! Por favor, siga estas diretrizes:

  • Faça um fork do projeto.
  • Crie uma branch para a funcionalidade que deseja implementar (git checkout -b minha-nova-feature).
  • Faça os commits com boas descrições (git commit -m 'Adiciona nova feature').
  • Faça um push para a branch criada (git push origin minha-nova-feature).
  • Abra um pull request para revisão.

Licença

Este projeto está licenciado sob a licença MIT - veja o arquivo LICENSE.md para mais detalhes.

Contato

Se você tiver alguma dúvida ou problema, entre em contato:

e-mail: [email protected]

Lordes Sith responsáveis pelo projeto

  • Darth Davi ⚔️😡

Mentora que propôs o desafio:

Profa. Artemisia Weyl

Github da mentora: https://github.com/arteweyl

Through victory, my chains are broken.
The Force shall free me.

About

🚀 Desafio ETL: Um projeto prático para explorar conceitos de ETL e criação de Data Lakes em nuvem! Ideal para quem deseja entender como extrair, transformar e carregar dados em um ambiente escalável e integrá-los com ferramentas de BI para visualização e análise!

Topics

Resources

License

Stars

Watchers

Forks

Languages