Eu já mostrei uma vez como testar diversos algoritmos numa tacada só no Python utilizando um simples loop e o pipeline do Scikit-Learn. Hoje, descobri outra coisa interessante, que já há um pacote que faz isso. É menos flexível do que a ideia que eu usava, mas é muito prático, afinal, você vai estar testando vários modelos numa tacada só – no Python, claro! Isso mesmo, mais de 20 modelos com somente 3 linhas de código. Bora aprender como fazer isso! Continuar a ler “Testando VÁRIOS modelos numa tacada só no Python!”
Etiqueta: modelo de machine learning
Machine Learning do Zero em Python (Classificador)
Já mostrei algumas vezes como construir um modelo preditivo, como nos posts Machine Learning do Zero no Python e Modelo de Classificação de Estilo Musical. Ambos foram bons posts, mas enquanto um foi mais simples e teve como saída uma variável contínua; o outro lidou com pipelines e teve como saída uma variável binária. Agora, ficou faltando conciliar um modelo mais simples, do zero, com uma saída binária. Este é o post de hoje! Dessa vez, temos um tutorial de Machine Learning DO ZERO em Python. Bora para o post! Continuar a ler “Machine Learning do Zero em Python (Classificador)”
Data Leakage, o erro que até os grandes cometem
Para criar um modelo de machine learning, temos uma etapa crucial na qual dividimos os dados em treino e teste. Isso ocorre porque queremos avaliar nosso modelo e evitar problemas de overfitting – que você pode ler mais sobre nos posts Overfitting, Explicando overfitting com uma anedota e Overfitting e Cross Validation. Hoje, quero falar de um problema muito comum que ocorre nesta etapa, o “vazamento” de dados para o teste. Bora falar de data leakage, o erro que até os grandes cometem.
Continuar a ler “Data Leakage, o erro que até os grandes cometem”