Regressão Logística em Python

Já falei de vários modelos aqui, principalmente a parte teórica dos econométricos. Em contrapartida, acabei deslizando no conteúdo de machine learning (ou modelagem estatística para os mais céticos) em Python. Bom, isso vai acabar. Hoje, vamos aprender a rodar uma regressão logística em Python. Continuar a ler “Regressão Logística em Python”

Formatação condicional em Python

E vamos de mais um post hoje para quem está migrando de Excel para Python. Na verdade, serve para cada um, mas sinto que saber a função deste post é algo que ex-usuários do Excel gostariam de saber. Vamos aprender a formatar a tabela, mudar cor de fundo, cor das letras, dentre outras coisas. Todas essas mudanças vão ser motivadas por alguns condicionais. Logo, o título, formatação condicional em Python! Continuar a ler “Formatação condicional em Python”

Gráficos cyberpunk no Python!

Esta foi a descoberta, se não mais útil, mais divertida que tive até agora no Python. Recentemente, foi lançado o pacote MPLCYBERPUNK. Essa biblioteca sensacional foi baseada no Matplotlib e faz gráficos que vai deixar os nerds que nem eu doidos. Sem mais delongas, hoje é dia de fazer gráficos Cyberpunk no Python! Continuar a ler “Gráficos cyberpunk no Python!”

Análise de texto usando Python

A análise de texto (~text mining) consiste no processo de obter informações através de dados no formato de um texto. Por se tratar de dados não-estruturados, a limpeza e tratativa é parte relevante e pouco trivial do processo. Falei brevemente de text mining no post Introdução ao Text Mining com Python. Hoje, volto ao tema utilizando uma biblioteca que me deixou bastante surpreso com seu poder de análise: a texthero! Continuar a ler “Análise de texto usando Python”

Tudo sobre valores missing no Pandas!

Lidar com valores nulos não é difícil para quem usa Pandas. Porém, é legal que o usuário tenha em mente todas as possibilidades, formas de identificar missing, como preenchê-los ou excluí-los, a depender da estratégia, dentre outras coisas. Se você está precisando de dicas para lidar com valores nulos no Pandas, este post é para você! Abaixo, temos diversas estratégias e comandos que serão úteis para quem está tendo que lidar com esse problema. Continuar a ler “Tudo sobre valores missing no Pandas!”

Tabela dinâmica no Python

Seguindo a linha de posts feitos para ajudar quem está migrando do Excel para o Python, hoje aprenderemos como fazer a famosa tabela dinâmica. Não tem muito segredo, você verá que o Pandas ajuda muito quem veio do Excel. Qualquer dúvida, deixe seu comentário. Se tiver elogios ou críticas, manda bala também! Continuar a ler “Tabela dinâmica no Python”

Filtros e seleções no Pandas

Sendo o Pandas a principal biblioteca do Python para fazer tratamentos nos dados, saber como localizar, selecionar e filtrar elementos nos dataframes dela é essencial. No vídeo de hoje, temos todas as formas de filtrar colunas e linhas, localizar a célula de acordo com a posição da linha e coluna ou a posição da linha e nome da coluna, dentre outras coisas. Abaixo, você encontra um vídeo contemplando as funções loc e iloc, o uso de pandasql, query, filter, e por aí vai. Bora pra mais um vídeo! Continuar a ler “Filtros e seleções no Pandas”

Jupyter Notebook: Introdução e dicas

O post de hoje é sobre uma das ferramentas mais utilizadas por cientistas de dados que utilizam o Python: o Jupyter Notebook. Aqui, vou te mostrar alguns passos da instalação (embora já tenha abordado de forma mais completa em Primeiros passos em Python), como utilizar a ferramenta e algumas dicas de uso. Bora! Continuar a ler “Jupyter Notebook: Introdução e dicas”

Gráficos no Seaborn – Parte 1 e 2

No post de hoje, você vai aprender a fazer gráficos utilizando um dos meus pacotes preferidos no Python, o Seaborn. Ele é um dos meus preferidos porque apesar de algumas customizações serem difíceis, o modo padrão dele é muito bom. Abaixo, você tem o tutorial de gráficos de dispersão – ou seja, para verificar a relação entre duas variáveis – e o gráfico de barras para medidas de tendência central – como a média de cada grupo, por exemplo. Continuar a ler “Gráficos no Seaborn – Parte 1 e 2”

Dividindo o dataset em treino e teste no Python

Quem está começando os primeiros modelos estatísticos sabe que uma coisa padrão é dividir a base em duas: treino e teste. A primeira é utilizada para construção do modelo e a segunda para testá-lo, verificar sua performance e entender se ele está overfittando – para overfitting, ler Overfitting e Explicando overfitting com uma anedota. Hoje, vamos ver como fazer essa divisão no Python. Bora! Continuar a ler “Dividindo o dataset em treino e teste no Python”