Missing no Python: Como Localizar e Substituir

Na vida real, as bases são bem diferentes do que costumamos ver na academia ou até mesmo em sites como o Kaggle. Sendo assim, é importante saber como lidar quando se deparar com um conjunto de dados em que haja algo faltando, em que existam campos missing. Vamos aprender como localizar linhas e colunas com missing, além de preencher essas células com algum valor. Bora aprender como tratar missing no python! Continuar a ler “Missing no Python: Como Localizar e Substituir”

Regressão Linear no Python

Como já expliquei em vários outros posts, Regressão Linear é uma técnica muito utilizada em modelagem – caso não se recorde, visite os posts Regressão Linear Simples – Parte 1Regressão Linear Simples – Parte 2Regressão Linear Simples – Parte 3 e Regressão Linear Múltipla. Em suma, um modelo linear será a soma ponderada de uma ou mais variáveis, chamadas de variáveis independentes ou explicativas, que irão predizer uma varável-alvo, também chamada de variável dependente ou resposta. Agora, vamos ver como você consegue rodar esse modelo no Python. Continuar a ler “Regressão Linear no Python”

Tutorial: Limpeza e Análise de Dados com Python

Hoje vamos aprender algumas coisas que podem ser feitas quando se trabalha com dataframes no Python. Como filtrar uma base? Como converter textos para números? Como extrair um valor de moeda no formato texto para o formato numérico? Como obter as estatísticas descritivas?  Como criar novas colunas? Como traçar um histograma? Como localizar valores nulos e preenchê-los com a média da coluna? Tudo isso e muito mais no post abaixo! Continuar a ler “Tutorial: Limpeza e Análise de Dados com Python”

Análise dos Jogadores de Fifa 19 Usando Python

Ok, confesso, este post é parcialmente um click bait. Parcialmente porque tem alguns códigos em Python, mas está tudo meio bagunçado ainda. De qualquer jeito, alguns podem se divertir, aprender como calcular correlação entre as variáveis de um Dataframe do Pandas, como calcular quartil, plotar histogramas já filtrando algum campo (ex.: Calcular a distribuição do campo Overall, mas só para jogadores cuja coluna Nacionalidade for England) e por aí vai. Continuar a ler “Análise dos Jogadores de Fifa 19 Usando Python”

Contar Valores Nulos (Missing) por Coluna no Python

Bom, o título é auto-explicativo: afinal de contas, como podemos saber a quantidade de valor nulos em cada coluna no Python (trabalhando com Dataframes no Pandas)? Continuar a ler “Contar Valores Nulos (Missing) por Coluna no Python”

Selecionando Apenas Colunas Numéricas no Python + Listando Todas as Colunas de um Dataframe (Pandas)

Recentemente fui analisar várias colunas de um dataframe no Python, mas as funções que estava utilizando eram todas numéricas. Ou seja, as colunas que não eram numéricas estavam atrapalhando meu código. Para resolver este problema, descobri que era possível selecionar somente as colunas numéricas no Python com uma função bem simples: Continuar a ler “Selecionando Apenas Colunas Numéricas no Python + Listando Todas as Colunas de um Dataframe (Pandas)”

Obter e Alterar o Working Directory no Python

Quando você trabalha no R, Python ou qualquer linguagem análoga, você está trabalhando os arquivos em algum diretório local. Quando você salvar o objeto de saída do seu código, ele será salvo neste diretório; quando você importar um arquivo escrevendo somente o nome do arquivo, ele só será importado se estiver neste diretório. Sendo assim, é importante saber em que diretório o software está trabalhando. Aqui, explico como obter o working directory no Python e como alterá-lo. Continuar a ler “Obter e Alterar o Working Directory no Python”

Group By no Python + Group By com Base Filtrada

O termo group by é muito popular para quem trabalha com base de dados. Quando temos repetições para o elemento chave e queremos fazer um resumo, um agrupamento, é esse o comando a ser utilizado. Um exemplo clássico é quando você tem os dados dos gastos feitos por clientes de uma loja e sua base contém um gasto por linha. Para obter o total gasto por cada cliente, você irá recorrer ao group by. Continuar a ler “Group By no Python + Group By com Base Filtrada”

Join / Merge no Python (Usando Pandas)

Assim como aprendemos no SQL, ou qualquer linguagem para manipulação de bases de dados, como unir bases de dados de diferentes maneiras, o Pandas nos permite fazer estas tratativas no Python. Abaixo, vamos aprender como fazer as uniões de tabelas e algumas táticas que podem facilitar sua vida. Continuar a ler “Join / Merge no Python (Usando Pandas)”