Como fazer procv – e outros JOINs – no Python

Novamente, um post tentando ajudar a galera que está migrando de Excel para Python. Mais especificamente, aqueles que estão apanhando tentando juntar diferentes datasets, trazer informação de outras bases para uma principal e coisas do tipo. Hoje, você vai aprender como fazer PROCV – função clássica do Excel – e outros joins no Python. Além, claro, de outras formas de fazer join! Bora lá! Continuar a ler “Como fazer procv – e outros JOINs – no Python”

Formatação condicional em Python

E vamos de mais um post hoje para quem está migrando de Excel para Python. Na verdade, serve para cada um, mas sinto que saber a função deste post é algo que ex-usuários do Excel gostariam de saber. Vamos aprender a formatar a tabela, mudar cor de fundo, cor das letras, dentre outras coisas. Todas essas mudanças vão ser motivadas por alguns condicionais. Logo, o título, formatação condicional em Python! Continuar a ler “Formatação condicional em Python”

Tudo sobre valores missing no Pandas!

Lidar com valores nulos não é difícil para quem usa Pandas. Porém, é legal que o usuário tenha em mente todas as possibilidades, formas de identificar missing, como preenchê-los ou excluí-los, a depender da estratégia, dentre outras coisas. Se você está precisando de dicas para lidar com valores nulos no Pandas, este post é para você! Abaixo, temos diversas estratégias e comandos que serão úteis para quem está tendo que lidar com esse problema. Continuar a ler “Tudo sobre valores missing no Pandas!”

Tabela dinâmica no Python

Seguindo a linha de posts feitos para ajudar quem está migrando do Excel para o Python, hoje aprenderemos como fazer a famosa tabela dinâmica. Não tem muito segredo, você verá que o Pandas ajuda muito quem veio do Excel. Qualquer dúvida, deixe seu comentário. Se tiver elogios ou críticas, manda bala também! Continuar a ler “Tabela dinâmica no Python”

Filtros e seleções no Pandas

Sendo o Pandas a principal biblioteca do Python para fazer tratamentos nos dados, saber como localizar, selecionar e filtrar elementos nos dataframes dela é essencial. No vídeo de hoje, temos todas as formas de filtrar colunas e linhas, localizar a célula de acordo com a posição da linha e coluna ou a posição da linha e nome da coluna, dentre outras coisas. Abaixo, você encontra um vídeo contemplando as funções loc e iloc, o uso de pandasql, query, filter, e por aí vai. Bora pra mais um vídeo! Continuar a ler “Filtros e seleções no Pandas”

Dividindo o dataset em treino e teste no Python

Quem está começando os primeiros modelos estatísticos sabe que uma coisa padrão é dividir a base em duas: treino e teste. A primeira é utilizada para construção do modelo e a segunda para testá-lo, verificar sua performance e entender se ele está overfittando – para overfitting, ler Overfitting e Explicando overfitting com uma anedota. Hoje, vamos ver como fazer essa divisão no Python. Bora! Continuar a ler “Dividindo o dataset em treino e teste no Python”

Análise exploratória SUPER-fácil no Python!

Fazer gráficos no Python não é a coisa mais fácil do mundo. Não que seja mega difícil, mas não é tão trivial. Construir dashboards menos ainda. Bom, era até um tempo atrás. Hoje você vai aprender sobre uma biblioteca no Python capaz de construir dashboards com apenas UMA linha de código. Continuar a ler “Análise exploratória SUPER-fácil no Python!”

Resolvendo UnicodeDecodeError no Python

Mais uma vez vamos lidar com um erro comum no Python, mais especificamente do Pandas, quando importamos um arquivo. Se você precisa lidar com arquivos em português, em algum momento já se deparou com esse erro:

UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8d in position 8: invalid start byte

Continuar a ler “Resolvendo UnicodeDecodeError no Python”

Conversão de texto para data no Python

Como sempre digo, lidar com data é uma dor de cabeça em qualquer linguagem. Com o tempo a gente se acostuma, mas no começo é bem chato e trabalhoso lembrar de todas as formas de converter. Sempre tem aquele rolo da data vir com hora, ou com mês abreviado, ou com mês completo. Pensando nisso, este post vai mostrar como converter alguns formatos de data que chegam em texto no seu dataframe. Continuar a ler “Conversão de texto para data no Python”

Como usar comandos de SQL no Python? (Bônus: Comando QUERY do Pandas)

Se tem uma linguagem que eu admiro muito é o SQL. Prático, não é case-sensitive, não tem problema de tabulação e às vezes nem precisa de ponto e vírgula. Além disso, é muito intuitiva, parece que você está falando em inglês o que a máquina deve fazer. Por isso, sempre é uma boa se aproveitar dessa linguagem. Abaixo, temos exemplos de como utilizá-la no Python. Continuar a ler “Como usar comandos de SQL no Python? (Bônus: Comando QUERY do Pandas)”