O objetivo deste repositório é apresentar alguns projetos de ciência de dados, para fins acadêmicos, autoaprendizagem e profissionais. Aqui você encontra os notebooks dos meus projetos na área de Data Science, Machine Learning e Data Analysis. Todo o material será apresentado através de arquivos .ipynbs feitos no Jupyter Notebook.
Link para contato:
- Blocker Fraud Company [ENG] - Proposta de modelo de Machine Learning para solucionar um problema de classificação, o algoritmo foi desenvolvido para detectar transações fraudulentas.
- OkCupid-Date-A-Scientist [ENG] - A proposta aqui é predizer se a pessoa é solteiro ou em alguma espécie de relacionamento, foi utilizado modelos classificadores com dados obtidos do aplicativo OkCupid.
- Spotify Songs Popularity Prediction [ENG] - Modelo de Machine Learning para solucionar um problema de regressão, utilizando de características técnicas de uma música para prever a sua popularidade no aplicativo Spotify. Confira o README do projeto.
- Insurance All Company [ENG] - Na empresa fictícia chamada Insurance All, o desafio será encontrar possíveis futuros clientes, gerar insights e analisar algumas estratégias para o time de vendas: será que se dobrássemos as metas teremos melhores resultados? O modelo atual é o mais lucrativo?
- Life Expectancy and GDP - Análise do PIB e expectativa de vida entre 6 países.
- Biodiversity [ENG] - Análise dos dados para investigar os status de conservação de espécies no National Park Service.
- U.S Medical Insurance Costs- Um projeto de análise de dados sobre custos de seguro médico nos EUA utilizando syntax do Python.
Meu nome é Vinicius Ferreira Amim, sou cientista de dados júnior e bacharel em engenharia mecânica pela Universidade Federal do Vale do São Francisco e tenho pós-graduação em Ciência de Dados e Big Data Analytics.
Trabalhei no setor industrial durante 3 anos fazendo análises para manutenções e rendimento de máquinas e equipamentos, a partir daí surgiu o interesse em Python e seus módulos para manipulação, processamento, limpeza de dados, Machine Learning, SQL etc.