Não vou mentir, pipeline sempre foi um tema negligenciado por mim. Não usava sempre que possível e, quando usava, era no automático. Usava somente por usar, mas nunca prestando atenção no seu potencial. De uns tempos para cá isso mudou. Neste post, vou introduzir o tema pela primeira vez aqui no EstatSite. Continuar a ler “Introdução aos Pipelines no Scikit-Learn”
Etiqueta: ciência de dados
Jupyter Notebook: Introdução e dicas
O post de hoje é sobre uma das ferramentas mais utilizadas por cientistas de dados que utilizam o Python: o Jupyter Notebook. Aqui, vou te mostrar alguns passos da instalação (embora já tenha abordado de forma mais completa em Primeiros passos em Python), como utilizar a ferramenta e algumas dicas de uso. Bora! Continuar a ler “Jupyter Notebook: Introdução e dicas”
Gráficos no Seaborn – Parte 1 e 2
No post de hoje, você vai aprender a fazer gráficos utilizando um dos meus pacotes preferidos no Python, o Seaborn. Ele é um dos meus preferidos porque apesar de algumas customizações serem difíceis, o modo padrão dele é muito bom. Abaixo, você tem o tutorial de gráficos de dispersão – ou seja, para verificar a relação entre duas variáveis – e o gráfico de barras para medidas de tendência central – como a média de cada grupo, por exemplo. Continuar a ler “Gráficos no Seaborn – Parte 1 e 2”
Dividindo o dataset em treino e teste no Python
Quem está começando os primeiros modelos estatísticos sabe que uma coisa padrão é dividir a base em duas: treino e teste. A primeira é utilizada para construção do modelo e a segunda para testá-lo, verificar sua performance e entender se ele está overfittando – para overfitting, ler Overfitting e Explicando overfitting com uma anedota. Hoje, vamos ver como fazer essa divisão no Python. Bora! Continuar a ler “Dividindo o dataset em treino e teste no Python”
Quer estagiar na área de Ciência de Dados?
Para quem não tem experiência nenhuma, mas quer começar a atuar na área, este post é para você! Continuar a ler “Quer estagiar na área de Ciência de Dados?”
Análise exploratória SUPER-fácil no Python!
Fazer gráficos no Python não é a coisa mais fácil do mundo. Não que seja mega difícil, mas não é tão trivial. Construir dashboards menos ainda. Bom, era até um tempo atrás. Hoje você vai aprender sobre uma biblioteca no Python capaz de construir dashboards com apenas UMA linha de código. Continuar a ler “Análise exploratória SUPER-fácil no Python!”
Como começar na área de Ciência de Dados?
Como entrar na área de ciência de dados sem ter experiência é provavelmente a pergunta que mais recebo na DM. Sempre respondo com prazer porque sei como é difícil para quem é jovem e está atrás do primeiro estágio ou quem já é mais velho e está em transição. Pensando nisso, fiz uma thread com algumas dicas, coisas que chamariam a atenção minha e de meus colegas quando precisamos trazer alguém para o time. Peço que perdoem as abreviações, no Twitter precisamos economizar caracteres e isso aqui é só um copia e cola da thread. Continuar a ler “Como começar na área de Ciência de Dados?”
Gabarito do Desafio
Finalmente chegamos com o gabarito do desafio lançado. Para quem não lembra ou não o fez, basta clicar neste link. São vários exercícios para você praticar análise exploratória, estatística descritiva, limpeza de dados, joins, wheres, ifs, etc. Abaixo, estão as respostas! Continuar a ler “Gabarito do Desafio”
5 Livros que Todo Cientista de Dados Deveria Ler!
Desafio do EstatSite
E finalmente chegou o grande dia! O desafio está lançado! Não esqueça, os dados que serão utilizados estão todos aqui. Se precisar entrar em contato por conta de alguma dúvida, o ideal é através da DM do Twitter, que é o @EstatSite. Lá é o local onde eu estou mais ativo.
O desafio ficará aberto por uma semana. Se estiver demorando, não se preocupe, é assim mesmo. Não é desafio de uma ou duas horas, vai levar tempo. Não desanime, lembre-se de que tem prêmio por participação (além do aprendizado que você vai ganhar!). Aceitarei entregas até o domingo dia 07/06/2020.
E, não se esqueça, assim que terminar envie a solução para estatsite@gmail.com! Boa sorte!!! Continuar a ler “Desafio do EstatSite”