Skip to content
This repository has been archived by the owner on Jun 29, 2024. It is now read-only.

Publicar um pacote com métodos utilitários e download dos datasets #10

Open
anapaulagomes opened this issue Jun 12, 2020 · 2 comments

Comments

@anapaulagomes
Copy link
Contributor

Talvez seja interessante ter em um pacote métodos para limpeza dos dados. Alguns deles já existem na Maria Quitéria. Além disso, poder fazer o download e carregamento dos dados chamando um método seria ótimo. Ao invés de baixar os arquivos e tê-los na pasta, qualquer pessoa desenvolvedora poderia rodar os notebooks e baixar os datasets em tempo de execução. Exemplo:

from dadosabertosdefeira.datasets.camara import Despesas

Exemplos dessa estratégia:

@guilhermelowa
Copy link
Collaborator

Sobre o pacote de limpeza: simm! Peguei as funções que você tinha feito e botei no ETL, num arquivo cleaners.py. Fiz tb uma função lá. Hoje ainda faço o PR.

Sobre o download, acho que seria muito massa! Fiquei viajando quando vi o do serenata de amor, mas não sei pra onde vai isso aí.. hahaha. Se for um negócio rápido acho que vale a pena fazer, né? Se for dar mais trabalho acho que não é tanto prioridade, pq é bem facinho de baixar etc

@anapaulagomes
Copy link
Contributor Author

Massa, @Jkasnese! Não esquece de fazer um rebase. Eu criei um parsers.py dentro do ETL.
Para qualquer método que tu adicionar, não esquece de adicionar testes unitários.

Sobre o download dos datasets eu acho melhor esperar mesmo. Imagino que não seria complexo mas temos outras coisas mais importantes no backlog. 😅

Sign up for free to subscribe to this conversation on GitHub. Already have an account? Sign in.
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants