Machine Learning do Zero em Python (Classificador)

Já mostrei algumas vezes como construir um modelo preditivo, como nos posts Machine Learning do Zero no Python e Modelo de Classificação de Estilo Musical. Ambos foram bons posts, mas enquanto um foi mais simples e teve como saída uma variável contínua; o outro lidou com pipelines e teve como saída uma variável binária. Agora, ficou faltando conciliar um modelo mais simples, do zero, com uma saída binária. Este é o post de hoje! Dessa vez, temos um tutorial de Machine Learning DO ZERO em Python. Bora para o post! Continuar a ler “Machine Learning do Zero em Python (Classificador)”

Gráficos no Seaborn – Parte 1 e 2

No post de hoje, você vai aprender a fazer gráficos utilizando um dos meus pacotes preferidos no Python, o Seaborn. Ele é um dos meus preferidos porque apesar de algumas customizações serem difíceis, o modo padrão dele é muito bom. Abaixo, você tem o tutorial de gráficos de dispersão – ou seja, para verificar a relação entre duas variáveis – e o gráfico de barras para medidas de tendência central – como a média de cada grupo, por exemplo. Continuar a ler “Gráficos no Seaborn – Parte 1 e 2”

Análise exploratória SUPER-fácil no Python!

Fazer gráficos no Python não é a coisa mais fácil do mundo. Não que seja mega difícil, mas não é tão trivial. Construir dashboards menos ainda. Bom, era até um tempo atrás. Hoje você vai aprender sobre uma biblioteca no Python capaz de construir dashboards com apenas UMA linha de código. Continuar a ler “Análise exploratória SUPER-fácil no Python!”

Gráficos em Python Usando Pyplot e Seaborn

É possível fazer excelentes análises exploratórias no Python. Na última live que fiz no meu canal da Twitch, www.twitch.tv/yukiolive, mostrei algumas funcionalidades do Matplotlib e Seaborn. Como fazer gráficos de dispersão, de barras, como alterar os eixos, alterar o tamanho da figura utilizando plt.figure(), alterar o título (incluindo o tamanho e cor da fonte), dentre outras tantas coisas. Caso você não tenha assistido a live, fica o convite. E se você tiver interesse em olhar o material – que eu acredito estar bem auto-explicativo – você pode acessar meu github no link abaixo e estudar tudo o que foi feito. Além de poder explorar algumas bases interessantes! Continuar a ler “Gráficos em Python Usando Pyplot e Seaborn”

Machine Learning do Zero no Python

Recentemente, estive na Python Brasil 2019. Um evento muito legal, falei um pouco sobre ele no Twitter do EstatSite (veja a thread aqui), e, inclusive, estou devendo um post aqui no blog. Acabei participando de um tutorial chamado “Machine Learning do Zero”, dado pelo Tarsis Azevedo – o cara é fera, recomendo que acompanhem o trabalho dele pelo Twitter ou Github, @tarsisazevedo. Aqui, vai o código feito em sala de aula, com algumas alterações e comentários que inclui porque achei relevante – outras porque achei que poderia facilitar para os mais novos

Atualização: Vocês agora podem visitar o post Regressão Linear no Python para aprender mais sobre regressão linear utilizando Python! Continuar a ler “Machine Learning do Zero no Python”

GGPLOT( ) é o Puro Creme dos Gráficos em R

Ok, o título é brega, mas eu tinha que chamar a atenção ao ggplot(). Embora já tenha falado do pacote ggplot2 em outros posts, a função ggplot() e todo seu poder de fogo mereciam um espaço inteiramente à eles. Aqui você vai aprender a fazer mais uma vez gráficos em barras, de dispersão, de linha, dentre outros, mas vai ver também várias formas de demonstrar a relação de 3 ou mais variáveis e de visualizar essas diferentes saídas. Como é um post mais específico e não tem aquele título para um objetivo específico, é possível que poucos o vejam. Se você está aqui, não feche a janela, sério, você não vai se arrepender. São só alguns minutinhos! Continuar a ler “GGPLOT( ) é o Puro Creme dos Gráficos em R”

Desenhando Gráficos de Diversas Variáveis no R

Algo muito útil para qualquer análise exploratória é poder traçar vários gráficos de uma vez só, num mesmo quadro. Tanto a possibilidade de traçar um histograma e um boxplot de uma determinada variável lado a lado, quanto a de traçar o histograma de todas as variáveis da base são muitos úteis na análise exploratória. Neste post, veremos algumas das possibilidades existentes no R: Continuar a ler “Desenhando Gráficos de Diversas Variáveis no R”

Gráficos com ou sem muitos detalhes?

Sempre tive um pé atrás com relação ao exagero em qualquer tipo de apresentação. Seja na minha dissertação de mestrado, que teve 33 páginas, ou nas apresentações no trabalho, onde evitava encher slides com muitas informações, preferia apresentar algo enxuto que focava no que importava. Por estes motivos, meus gráficos sempre foram os mais simples possíveis. Achava inclusive que encher de detalhes, legendas e outras anotações, iria tirar o foco do leitor. Mas o que diz a literatura sobre isso? Continuar a ler “Gráficos com ou sem muitos detalhes?”

Exercício: Analisar Gráficos que Induzem ao Erro na Interpretação

Resolvi compartilhar um exercício que tive que fazer, no qual o objetivo era analisar um gráfico e localizar suas falhas. Isto tudo com base num trabalho de Alberto Cairo, chamado Graphics Lies, Misleading Visuals (recomendadíssimo!). Recebi 15/15 pontos de três avaliadores, mas fica aí aberto para quem tiver críticas ou sugestões. Recomendo também que façam este tipo de exercício, ainda que não tenham um avaliador. Só o fato de parar para pensar no tema já traz uma boa evolução. Continuar a ler “Exercício: Analisar Gráficos que Induzem ao Erro na Interpretação”