Tipos de Aprendizado em Machine Learning

Quando falamos de Machine Learning, estamos falando de “máquinas que aprendem”, como o próprio nome já diz. Porém, há várias formas das máquinas aprenderem, diversos tipos de algoritmo. Fazemos essa distinção através do que chamamos de tipos de aprendizado em Machine Learning. O aprendizado pode ser supervisionado, não-supervisionado e semi-supervisionado. Abaixo, as explicações de cada um deles. Continuar a ler “Tipos de Aprendizado em Machine Learning”

Ciência de Dados em Português por Menos de 30 Reais

Muita gente ingressou nesse mundo de dados este ano. Porém, nem todo mundo encontra tão facilmente materiais e cursos baratos. Os cursos de fora são muito mais baratos, mas nem todo mundo fala inglês bem. Pensando nisso, eu peguei um reply que fiz em um tweet, dei um tapa e montei aqui uma trilha de Ciência de Dados em Português e custando menos de 30 reais! Continuar a ler “Ciência de Dados em Português por Menos de 30 Reais”

Análise de dados em Python sem programação

Você provavelmente já deve ter notado que as ferramentas low code estão se multiplicando. Existem bibliotecas de Auto-ML e Auto-EDA, as nuvens já possuem suas próprias tecnologias, grandes empresas com H2o criando ferramentas o tempo todo, e por aí vai. E na linguagem dominante no mercado de Data Science, isso também é realidade. Hoje, vamos ver como fazer uma análise de dados em Python sem programação! Continuar a ler “Análise de dados em Python sem programação”

3 Funcionalidades Incríveis do IPython

Nem todo mundo conhece, mas o IPython é uma “iteractive shell” (shell iterativo?), uma forma de adicionar funcionalidades ao nosso programa muito útil. A ideia vai um pouco além disso e você pode explorar um pouco mais indo neste link, mas para nós, vale apenas pensar como se fosse um pacote diferentão que vai trazer features para facilitar nosso trabalho, como mostrar vários outputs de uma célula ou colocar uma música no fim da execução de um trecho do código. Enfim, bora conhecer 3 funcionalidades incríveis do IPython hoje! Vamo que vamo! Continuar a ler “3 Funcionalidades Incríveis do IPython”

Testando VÁRIOS modelos numa tacada só no Python!

Eu já mostrei uma vez como testar diversos algoritmos numa tacada só no Python utilizando um simples loop e o pipeline do Scikit-Learn. Hoje, descobri outra coisa interessante, que já há um pacote que faz isso. É menos flexível do que a ideia que eu usava, mas é muito prático, afinal, você vai estar testando vários modelos numa tacada só – no Python, claro! Isso mesmo, mais de 20 modelos com somente 3 linhas de código. Bora aprender como fazer isso! Continuar a ler “Testando VÁRIOS modelos numa tacada só no Python!”

10 livros de Data Science disponíveis online!

Se tem uma coisa boa dos tempos modernos é a facilidade em aprender absolutamente QUALQUER coisa pela internet. E o melhor de tudo é a qualidade do conteúdo. Não só temos bons canais e blogs, como também temos conteúdos de universidades de ponta e de editoras renomadas. Pensando nisso, hoje eu resolvi trazer uma lista de 10 livros de Data Science disponíveis online e totalmente gratuitos! Continuar a ler “10 livros de Data Science disponíveis online!”

Exercícios de SQL

Como disse no Twitter do blog, @Estatsite, SQL é uma linguagem que acaba sendo difícil de adaptar nos cursos as tarefas que vemos no dia à dia. Pensando nisso, resolvi separar uma série de exercícios com desafios que já enfrentei em algum momento. Não são mega difíceis, mas a resolução é bem menos direta do que vemos em alguns tutoriais. Bora! Continuar a ler “Exercícios de SQL”

Machine Learning do Zero em Python (Classificador)

Já mostrei algumas vezes como construir um modelo preditivo, como nos posts Machine Learning do Zero no Python e Modelo de Classificação de Estilo Musical. Ambos foram bons posts, mas enquanto um foi mais simples e teve como saída uma variável contínua; o outro lidou com pipelines e teve como saída uma variável binária. Agora, ficou faltando conciliar um modelo mais simples, do zero, com uma saída binária. Este é o post de hoje! Dessa vez, temos um tutorial de Machine Learning DO ZERO em Python. Bora para o post! Continuar a ler “Machine Learning do Zero em Python (Classificador)”

Modelo de Classificação de Estilo Musical

Recentemente, fiz um dos projetos disponíveis na plataforma do Datacamp – tenho uma assinatura anual que fiz no início da pandemia. A ideia era criar um modelo que classificasse o estilo musical com base em algumas características da música. Este post é dedicado a explicar um pouco do código e dar uma base com outros posts para que você consiga acompanhar o conteúdo dele. Enfim, bora aprender um modelo legal de classificação de estilo musical em Python! Continuar a ler “Modelo de Classificação de Estilo Musical”

Data Leakage, o erro que até os grandes cometem

Para criar um modelo de machine learning, temos uma etapa crucial na qual dividimos os dados em treino e teste. Isso ocorre porque queremos avaliar nosso modelo e evitar problemas de overfitting – que você pode ler mais sobre nos posts OverfittingExplicando overfitting com uma anedota e Overfitting e Cross Validation.  Hoje, quero falar de um problema muito comum que ocorre nesta etapa, o “vazamento” de dados para o teste. Bora falar de data leakage, o erro que até os grandes cometem.

Continuar a ler “Data Leakage, o erro que até os grandes cometem”