Você deve usar os dados de séries do IMDB (Internet Movie DataBase) para fazer uma análise exploratória de dados em uma série de sua escolha. A série deve ter no mínimo 4 temporadas. A análise deve ser um relatório em Jupyter Notebook, a partir do arquivo relatorio.ipynb
. O relatório já possui algumas perguntas a serem respondidas. Use as perguntas como base, mas não fique preso a elas. Você pode fazer novas perguntas e novas análises à vontade.
O relatório deve ser legível e compreensível por alguém que não está na disciplina. Não precisa explicar como ler cada gráfico, mas tente ajudar a ver os resultados que você quer mostrar, e caso você use conceitos como IQR e desvio padrão, dê uma ajuda ao leitor.
O arquivo usado para avaliação está em dados/avaliacao_episodios_series_top.csv
. Estes dados foram gerados a partir de dados disponíveis no IMDB. Cada linha do arquivo possui dados de um episódio de uma série. As colunas são as seguintes:
id_serie
: identificador da série.nome_serie
: nome da série.id_episodio
: identificador do episódio.num_temporada
: número da temporada.num_episodio
: número do episódio.nome_episodio
: nome do episódio.ano
: ano do episódio.duracao_minutos
: duração do episódio em minutos.generos
: gêneros do episódio.avaliacao_media
: avaliação média do episódio pelos usuários do IMDB.num_votos
: quantidade de votos (avaliações) pelos usuários do IMDB.
Information courtesy of IMDb (http://www.imdb.com). Used with permission. Non-commercial use only.
Downloaded at: https://datasets.imdbws.com/