Tipos de Aprendizado em Machine Learning

Quando falamos de Machine Learning, estamos falando de “máquinas que aprendem”, como o próprio nome já diz. Porém, há várias formas das máquinas aprenderem, diversos tipos de algoritmo. Fazemos essa distinção através do que chamamos de tipos de aprendizado em Machine Learning. O aprendizado pode ser supervisionado, não-supervisionado e semi-supervisionado. Abaixo, as explicações de cada um deles. Continuar a ler “Tipos de Aprendizado em Machine Learning”

3 Funcionalidades Incríveis do IPython

Nem todo mundo conhece, mas o IPython é uma “iteractive shell” (shell iterativo?), uma forma de adicionar funcionalidades ao nosso programa muito útil. A ideia vai um pouco além disso e você pode explorar um pouco mais indo neste link, mas para nós, vale apenas pensar como se fosse um pacote diferentão que vai trazer features para facilitar nosso trabalho, como mostrar vários outputs de uma célula ou colocar uma música no fim da execução de um trecho do código. Enfim, bora conhecer 3 funcionalidades incríveis do IPython hoje! Vamo que vamo! Continuar a ler “3 Funcionalidades Incríveis do IPython”

Modelo de Classificação de Estilo Musical

Recentemente, fiz um dos projetos disponíveis na plataforma do Datacamp – tenho uma assinatura anual que fiz no início da pandemia. A ideia era criar um modelo que classificasse o estilo musical com base em algumas características da música. Este post é dedicado a explicar um pouco do código e dar uma base com outros posts para que você consiga acompanhar o conteúdo dele. Enfim, bora aprender um modelo legal de classificação de estilo musical em Python! Continuar a ler “Modelo de Classificação de Estilo Musical”

Regressão Ridge e Lasso

Regressão linear é o primeiro algoritmo que aprendemos quando estudamos ciência de dados e machine learning. Apesar de muito útil, o algoritmo buscará sempre minimizar a soma dos quadrados de forma que se obtenha um modelo com o menor erro possível. Isso pode levar ao problema de overfitting (já explicado em posts como Overfitting e Cross Validation e Explicando overfitting com uma anedota). Uma forma de resolver isso é utilizando a regressão ridge ou lasso!
Continuar a ler “Regressão Ridge e Lasso”

XGBoost em Python

Hoje é dia de seguir com a minha promessa de abordar mais Machine Learning em Python, algo que acabei negligenciando nos últimos meses. Dessa vez, você vai aprender como rodar um XGBoost em Python. Tal qual ocorreu em Regressão Logística em Python e Random Forest em Python, a ideia é você ter um esqueleto para apenas inserir seu dataset e correr para o abraço. Vamos lá! Continuar a ler “XGBoost em Python”

Classificador Random Forest em Python

Conforme tenho dito nos últimos posts, estou entrando numa fase de voltar a escrever sobre Machine Learning. Logo, não poderia deixar de falar de um dos modelos que ainda vejo como um dos mais utilizados no mercado, que é a Random Forest. Se você nunca ouviu falar desse modelo, recomendo o vídeo do StatQuest Random Forest Part 1. Após ver o vídeo, volte para aprender como rodar uma random forest, como classificador, em Python! Continuar a ler “Classificador Random Forest em Python”

Pipeline usando Scikit-Learn: Exemplos Práticos

No post Introdução aos Pipelines no Scikit-Learn, mostrei alguns exemplos de pipelines utilizando a biblioteca mais famosa para machine learning no Python. Hoje, quero mostrar alguns exemplos de pipelines com diferentes funcionalidades. Sendo assim, será um post bastante direto e prático, mas que deve ajudar bastante o leitor. Bora ver logo exemplos práticos de pipelines usando scikit-learn! Continuar a ler “Pipeline usando Scikit-Learn: Exemplos Práticos”

Os melhores podcasts de ciência de dados!

Se você é uma pessoa antenada, provavelmente já escutou que 2020 é o ano dos podcasts. Com o investimento mais pesado nos últimos anos de grandes empresas como a Rede Globo, na produção de conteúdo, e o Spotify, como plataforma de distribuição, o produto ganha cada vez mais espaço na vida do brasileiro. E é claro que a nossa área não ficou de fora do hype. Sendo assim, o post de hoje vai trazer uma lsita com os melhores podcasts de ciência de dados! Continuar a ler “Os melhores podcasts de ciência de dados!”

Introdução aos Pipelines no Scikit-Learn

Não vou mentir, pipeline sempre foi um tema negligenciado por mim. Não usava sempre que possível e, quando usava, era no automático. Usava somente por usar, mas nunca prestando atenção no seu potencial. De uns tempos para cá isso mudou. Neste post, vou introduzir o tema pela primeira vez aqui no EstatSite. Continuar a ler “Introdução aos Pipelines no Scikit-Learn”

Quer estagiar na área de Ciência de Dados?

Para quem não tem experiência nenhuma, mas quer começar a atuar na área, este post é para você! Continuar a ler “Quer estagiar na área de Ciência de Dados?”