Finalmente chegamos com o gabarito do desafio lançado. Para quem não lembra ou não o fez, basta clicar neste link. São vários exercícios para você praticar análise exploratória, estatística descritiva, limpeza de dados, joins, wheres, ifs, etc. Abaixo, estão as respostas!
1) Clube mais forte: Juventus com overall médio de 82.28.
Clube mais fraco: Bohemian FC com overall médio de 55.
2) Espanha, overall médio de 86.3
3) Top 5:
4)
5)
6)
7)
8) Primeiras 5 linhas:
9) Apesar do xtick contemplar 2019, os dados foram filtrados até 2018.
(que péssima a ideia de plotar as 4 séries juntas rs)
10)
Há duas respostas possíveis para a parte 2 no que diz respeito o desvio padrão. Pode retornar nulo nos casos que só há 1 elemento ou você poderia ter calculado com graus de liberdade igual a zero e retornado zero. Seria correto também.
11) Aqui, também seria aceito se o boxplot estivesse agrupado por estado. Mas não era necessário.
12)
13) Essa vocês terão que adaptar para a linguagem que trabalham, há várias maneiras de se fazer.
14) Esse vou deixar duas formas de fazer:
15) Esse a maioria errou, creio que muitos não tenham entendido, mas olhando a lógica tenho certeza de que conseguirão replicar:
O meu jupyter notebook com a resolução está neste link: Gabarito
Digam aí o que vocês acharam do desafio. Seja por e-mail, por DM ou aqui nos comentários. Apesar de ter sido cansativo, já que cuido do blog e de várias outras coisas sozinho – e também tenho minha vida né, trabalho, cursos, descanso rs -, eu gostei bastante de fazer.
Se vocês curtiram, eu posso ver de criar mais desafios no futuro. Preciso dar uma economizada porque quero que tenha prêmios, acho que isso motiva o pessoal; mas eu animo se vocês animarem hahaha
Deixem seus feedbacks, indiquem o blog, o canal do Youtube e o Twitter e se divirtam porque Ciência de Dados é uma delícia de estudar (e juro que não tem ironia nisso).
Forte abraço e obrigado por fazer parte disso tudo!