Testando VÁRIOS modelos numa tacada só no Python!

Eu já mostrei uma vez como testar diversos algoritmos numa tacada só no Python utilizando um simples loop e o pipeline do Scikit-Learn. Hoje, descobri outra coisa interessante, que já há um pacote que faz isso. É menos flexível do que a ideia que eu usava, mas é muito prático, afinal, você vai estar testando vários modelos numa tacada só – no Python, claro! Isso mesmo, mais de 20 modelos com somente 3 linhas de código. Bora aprender como fazer isso! Continuar a ler “Testando VÁRIOS modelos numa tacada só no Python!”

Machine Learning do Zero em Python (Classificador)

Já mostrei algumas vezes como construir um modelo preditivo, como nos posts Machine Learning do Zero no Python e Modelo de Classificação de Estilo Musical. Ambos foram bons posts, mas enquanto um foi mais simples e teve como saída uma variável contínua; o outro lidou com pipelines e teve como saída uma variável binária. Agora, ficou faltando conciliar um modelo mais simples, do zero, com uma saída binária. Este é o post de hoje! Dessa vez, temos um tutorial de Machine Learning DO ZERO em Python. Bora para o post! Continuar a ler “Machine Learning do Zero em Python (Classificador)”

Data Leakage, o erro que até os grandes cometem

Para criar um modelo de machine learning, temos uma etapa crucial na qual dividimos os dados em treino e teste. Isso ocorre porque queremos avaliar nosso modelo e evitar problemas de overfitting – que você pode ler mais sobre nos posts OverfittingExplicando overfitting com uma anedota e Overfitting e Cross Validation.  Hoje, quero falar de um problema muito comum que ocorre nesta etapa, o “vazamento” de dados para o teste. Bora falar de data leakage, o erro que até os grandes cometem.

Continuar a ler “Data Leakage, o erro que até os grandes cometem”