Desafio do EstatSite

E finalmente chegou o grande dia! O desafio está lançado! Não esqueça, os dados que serão utilizados estão todos aqui. Se precisar entrar em contato por conta de alguma dúvida, o ideal é através da DM do Twitter, que é o @EstatSite. Lá é o local onde eu estou mais ativo.

O desafio ficará aberto por uma semana. Se estiver demorando, não se preocupe, é assim mesmo. Não é desafio de uma ou duas horas, vai levar tempo. Não desanime, lembre-se de que tem prêmio por participação (além do aprendizado que você vai ganhar!). Aceitarei entregas até o domingo dia 07/06/2020.

E, não se esqueça, assim que terminar envie a solução para estatsite@gmail.com! Boa sorte!!! Continuar a ler “Desafio do EstatSite”

Datasets para Praticar Modelos de Machine Learning

Você estuda, estuda, estuda, e estuda um pouco mais, mas é isso. Lê livros, vê vídeos no Youtube, mas permanece somente na teoria. Chega uma hora que você precisa colocar seu conhecimento em prática. Aplicar Árvore de Decisão, Random Forest, Regressão Linear, Regressão Logística e por aí vai. Abaixo, uma lista de datasets populares e quais técnicas você pode testar neles. Continuar a ler “Datasets para Praticar Modelos de Machine Learning”

Correlação e Causa: O Caso da Regressão Linear

Que correlação não implica causa já é algo que está ficando cada vez mais manjado. Não é mais necessário ser um estatístico ou economista para saber isso. Baste um pouco de conhecimento em análise de dados. O curioso é que para muitas pessoas, isso pode ser resolvido com uma regressão linear. Não é verdade. Continuar a ler “Correlação e Causa: O Caso da Regressão Linear”

Teste seus Conhecimentos em Data Science!

Quase que semanalmente, tenho feito alguns quizzes no twitter do EstatSite – você pode seguir indo em @EstatSite – sobre ciência de dados. As perguntas variam e vão desde questões sobre interpretação de gráficos até premissas utilizadas em modelos bastante comuns. Veja uns exemplos: Continuar a ler “Teste seus Conhecimentos em Data Science!”

Gráficos em Python Usando Pyplot e Seaborn

É possível fazer excelentes análises exploratórias no Python. Na última live que fiz no meu canal da Twitch, www.twitch.tv/yukiolive, mostrei algumas funcionalidades do Matplotlib e Seaborn. Como fazer gráficos de dispersão, de barras, como alterar os eixos, alterar o tamanho da figura utilizando plt.figure(), alterar o título (incluindo o tamanho e cor da fonte), dentre outras tantas coisas. Caso você não tenha assistido a live, fica o convite. E se você tiver interesse em olhar o material – que eu acredito estar bem auto-explicativo – você pode acessar meu github no link abaixo e estudar tudo o que foi feito. Além de poder explorar algumas bases interessantes! Continuar a ler “Gráficos em Python Usando Pyplot e Seaborn”

Trilha para Data Science em R (Springer)

Como vocês já sabem, a Springer disponibilizou diversos livros gratuitos. Dentre eles, há vários que podem ser utilizados para aprender mais sobre Ciência de Dados (separei alguns no post Livros da Springer – Gratuitos). Aqui, separei uma trilha de Data Science em R somente utilizando os livros disponibilizados por eles: Continuar a ler “Trilha para Data Science em R (Springer)”

Minha Trilha para Se Tornar um Cientista de Dados

A pergunta que mais recebo é de longe, mas disparado MESMO, quais livros alguém deve seguir para sair do zero e se tornar um cientista de dados. Pensando nisso, resolvi fazer esse post com uma trilha do que considero o ideal para alguém partir do zero e se tornar um cientista de dados. Claro, pode existir um assunto ou outro fora daqui que você pode acabar se deparando quando for efetivamente um profissional da área. Ainda assim, acho que deu para cobrir o essencial. Continuar a ler “Minha Trilha para Se Tornar um Cientista de Dados”

O Problema dos Gráficos com Dois Eixos-Y

Gráficos com dois eixos-y são constantemente criticados por estatísticos e economistas, ao menos entre os mais experientes com análise exploratória. Para os leigos ou com pouco contato com esse tipo de análise é meio estranho essa implicância. Mas acredite em mim, não é em vão. Continuar a ler “O Problema dos Gráficos com Dois Eixos-Y”

Livros da Springer disponíveis para download gratuitos

A Springer liberou diversos livros para download em PDF. É uma editora excelente, uma das minhas preferidas junto com a O’Reilly. Vale a pena conferir alguns para Ciência de Dados: Continuar a ler “Livros da Springer disponíveis para download gratuitos”