XGBoost em Python

Hoje é dia de seguir com a minha promessa de abordar mais Machine Learning em Python, algo que acabei negligenciando nos últimos meses. Dessa vez, você vai aprender como rodar um XGBoost em Python. Tal qual ocorreu em Regressão Logística em Python e Random Forest em Python, a ideia é você ter um esqueleto para apenas inserir seu dataset e correr para o abraço. Vamos lá! Continuar a ler “XGBoost em Python”

Classificador Random Forest em Python

Conforme tenho dito nos últimos posts, estou entrando numa fase de voltar a escrever sobre Machine Learning. Logo, não poderia deixar de falar de um dos modelos que ainda vejo como um dos mais utilizados no mercado, que é a Random Forest. Se você nunca ouviu falar desse modelo, recomendo o vídeo do StatQuest Random Forest Part 1. Após ver o vídeo, volte para aprender como rodar uma random forest, como classificador, em Python! Continuar a ler “Classificador Random Forest em Python”

Calculando o tempo de execução em Python e R

Saber quanto tempo seu script está demorando para ser executado pode ser muito útil. Seja porque você está querendo melhorar o código e quer fazer comparações, ou porque algum processo é demorado e você quer mensurar seu tempo de execução, saber obter este tempo é sempre vantajoso. Sendo assim, hoje vamos aprender como calcular o tempo da execução de um script tanto em Python quanto em R. Continuar a ler “Calculando o tempo de execução em Python e R”

Regressão Logística em Python

Já falei de vários modelos aqui, principalmente a parte teórica dos econométricos. Em contrapartida, acabei deslizando no conteúdo de machine learning (ou modelagem estatística para os mais céticos) em Python. Bom, isso vai acabar. Hoje, vamos aprender a rodar uma regressão logística em Python. Continuar a ler “Regressão Logística em Python”

Construindo seu primeiro app em Python

Recentemente, comecei a trabalhar um pouco mais com produtos de dados. Isso no sentido de pequenos apps para automatizar processos e democratizar o acesso à informação e análises. Por conta disso, decidi que deveria fazer uns posts no blog. Este é o primeiro, vai ser muito simples e breve. Você talvez até me xingue, mas é sério, é útil esse comecinho. Sem mais falatório, bora construir seu primeiro app em Python! Continuar a ler “Construindo seu primeiro app em Python”

Formatação condicional em Python

E vamos de mais um post hoje para quem está migrando de Excel para Python. Na verdade, serve para cada um, mas sinto que saber a função deste post é algo que ex-usuários do Excel gostariam de saber. Vamos aprender a formatar a tabela, mudar cor de fundo, cor das letras, dentre outras coisas. Todas essas mudanças vão ser motivadas por alguns condicionais. Logo, o título, formatação condicional em Python! Continuar a ler “Formatação condicional em Python”

Gráficos cyberpunk no Python!

Esta foi a descoberta, se não mais útil, mais divertida que tive até agora no Python. Recentemente, foi lançado o pacote MPLCYBERPUNK. Essa biblioteca sensacional foi baseada no Matplotlib e faz gráficos que vai deixar os nerds que nem eu doidos. Sem mais delongas, hoje é dia de fazer gráficos Cyberpunk no Python! Continuar a ler “Gráficos cyberpunk no Python!”

Pipeline usando Scikit-Learn: Exemplos Práticos

No post Introdução aos Pipelines no Scikit-Learn, mostrei alguns exemplos de pipelines utilizando a biblioteca mais famosa para machine learning no Python. Hoje, quero mostrar alguns exemplos de pipelines com diferentes funcionalidades. Sendo assim, será um post bastante direto e prático, mas que deve ajudar bastante o leitor. Bora ver logo exemplos práticos de pipelines usando scikit-learn! Continuar a ler “Pipeline usando Scikit-Learn: Exemplos Práticos”

Análise de texto usando Python

A análise de texto (~text mining) consiste no processo de obter informações através de dados no formato de um texto. Por se tratar de dados não-estruturados, a limpeza e tratativa é parte relevante e pouco trivial do processo. Falei brevemente de text mining no post Introdução ao Text Mining com Python. Hoje, volto ao tema utilizando uma biblioteca que me deixou bastante surpreso com seu poder de análise: a texthero! Continuar a ler “Análise de texto usando Python”

Tudo sobre valores missing no Pandas!

Lidar com valores nulos não é difícil para quem usa Pandas. Porém, é legal que o usuário tenha em mente todas as possibilidades, formas de identificar missing, como preenchê-los ou excluí-los, a depender da estratégia, dentre outras coisas. Se você está precisando de dicas para lidar com valores nulos no Pandas, este post é para você! Abaixo, temos diversas estratégias e comandos que serão úteis para quem está tendo que lidar com esse problema. Continuar a ler “Tudo sobre valores missing no Pandas!”