Tipos de Aprendizado em Machine Learning

Quando falamos de Machine Learning, estamos falando de “máquinas que aprendem”, como o próprio nome já diz. Porém, há várias formas das máquinas aprenderem, diversos tipos de algoritmo. Fazemos essa distinção através do que chamamos de tipos de aprendizado em Machine Learning. O aprendizado pode ser supervisionado, não-supervisionado e semi-supervisionado. Abaixo, as explicações de cada um deles. Continuar a ler “Tipos de Aprendizado em Machine Learning”

9 Apps para Cientistas de Dados

Nem tudo que a gente consome precisa estar diretamente ligado à programação. Como todo profissional, o cientista de dados precisa estudar, ter foco, ser produtivo, dentre outras coisas. Pensando nisso, fiz uma lista contendo 9 apps para cientistas de dados, misturando conteúdos de programação e data science com produtividade e estudos de um modo geral. Continuar a ler “9 Apps para Cientistas de Dados”

Ciência de Dados em Português por Menos de 30 Reais

Muita gente ingressou nesse mundo de dados este ano. Porém, nem todo mundo encontra tão facilmente materiais e cursos baratos. Os cursos de fora são muito mais baratos, mas nem todo mundo fala inglês bem. Pensando nisso, eu peguei um reply que fiz em um tweet, dei um tapa e montei aqui uma trilha de Ciência de Dados em Português e custando menos de 30 reais! Continuar a ler “Ciência de Dados em Português por Menos de 30 Reais”

Análise de dados em Python sem programação

Você provavelmente já deve ter notado que as ferramentas low code estão se multiplicando. Existem bibliotecas de Auto-ML e Auto-EDA, as nuvens já possuem suas próprias tecnologias, grandes empresas com H2o criando ferramentas o tempo todo, e por aí vai. E na linguagem dominante no mercado de Data Science, isso também é realidade. Hoje, vamos ver como fazer uma análise de dados em Python sem programação! Continuar a ler “Análise de dados em Python sem programação”

Testando VÁRIOS modelos numa tacada só no Python!

Eu já mostrei uma vez como testar diversos algoritmos numa tacada só no Python utilizando um simples loop e o pipeline do Scikit-Learn. Hoje, descobri outra coisa interessante, que já há um pacote que faz isso. É menos flexível do que a ideia que eu usava, mas é muito prático, afinal, você vai estar testando vários modelos numa tacada só – no Python, claro! Isso mesmo, mais de 20 modelos com somente 3 linhas de código. Bora aprender como fazer isso! Continuar a ler “Testando VÁRIOS modelos numa tacada só no Python!”

Exercícios de SQL

Como disse no Twitter do blog, @Estatsite, SQL é uma linguagem que acaba sendo difícil de adaptar nos cursos as tarefas que vemos no dia à dia. Pensando nisso, resolvi separar uma série de exercícios com desafios que já enfrentei em algum momento. Não são mega difíceis, mas a resolução é bem menos direta do que vemos em alguns tutoriais. Bora! Continuar a ler “Exercícios de SQL”

Machine Learning do Zero em Python (Classificador)

Já mostrei algumas vezes como construir um modelo preditivo, como nos posts Machine Learning do Zero no Python e Modelo de Classificação de Estilo Musical. Ambos foram bons posts, mas enquanto um foi mais simples e teve como saída uma variável contínua; o outro lidou com pipelines e teve como saída uma variável binária. Agora, ficou faltando conciliar um modelo mais simples, do zero, com uma saída binária. Este é o post de hoje! Dessa vez, temos um tutorial de Machine Learning DO ZERO em Python. Bora para o post! Continuar a ler “Machine Learning do Zero em Python (Classificador)”

Funções, While, For e Conversor de Binário em Python

Como já disse em posts passados, estou tentando trazer conteúdo para ativar o lado “programador raiz” de quem acessa o blog. Isso no sentido de trabalhar lógica, linguagem orientada a objetos, dentre outras coisas. Caso você não tenha visto, os posts Construindo seu primeiro app em Python e Uma introdução a Python orientado a objetos: Construção de classes ficaram bem interessantes. Pensando nisso, hoje vamos abordar um exercício clássico dos cursos de introdução à programação: como converter decimal para binário. Porém, isso está acompanhado de funções e loops! Continuar a ler “Funções, While, For e Conversor de Binário em Python”

Classificador Random Forest em Python

Conforme tenho dito nos últimos posts, estou entrando numa fase de voltar a escrever sobre Machine Learning. Logo, não poderia deixar de falar de um dos modelos que ainda vejo como um dos mais utilizados no mercado, que é a Random Forest. Se você nunca ouviu falar desse modelo, recomendo o vídeo do StatQuest Random Forest Part 1. Após ver o vídeo, volte para aprender como rodar uma random forest, como classificador, em Python! Continuar a ler “Classificador Random Forest em Python”

Análise de texto usando Python

A análise de texto (~text mining) consiste no processo de obter informações através de dados no formato de um texto. Por se tratar de dados não-estruturados, a limpeza e tratativa é parte relevante e pouco trivial do processo. Falei brevemente de text mining no post Introdução ao Text Mining com Python. Hoje, volto ao tema utilizando uma biblioteca que me deixou bastante surpreso com seu poder de análise: a texthero! Continuar a ler “Análise de texto usando Python”