Entrevista com Diego Camacho, CDO e Fundador da Trieduc

Hoje, trago um bate-papo com Diego Camacho, estatístico, cientista de dados, ampla experiência no varejo e em pesquisas eleitorais, CDO e fundador da Trieduc, e tudo mais que vocês podem encontrar no Linkedin dele. Falamos sobre a carreira de cientista de dados, sobre o cargo de CDO nas empresas, dentre muitas outras coisas. Continuar a ler “Entrevista com Diego Camacho, CDO e Fundador da Trieduc”

Gabarito do Desafio

Finalmente chegamos com o gabarito do desafio lançado. Para quem não lembra ou não o fez, basta clicar neste link. São vários exercícios para você praticar análise exploratória, estatística descritiva, limpeza de dados, joins, wheres, ifs, etc. Abaixo, estão as respostas! Continuar a ler “Gabarito do Desafio”

A primeira (mini)competição do EstatSite chegou!

Estive pensando em formas de divulgar o blog e o canal do Youtube. No começo, pensei em fazer aqueles posts pedindo para marcar um amigo e sortear alguém nos comentários. Só que isso ia ser meio chato e não ajudaria tanto os participantes, a não ser o ganhador. Então resolvi promover essa mini-competição, de nível básico/intermediário. Por favor, leia o post até o final para saber todas as regras. Continuar a ler “A primeira (mini)competição do EstatSite chegou!”

Minha Trilha para Se Tornar um Cientista de Dados

A pergunta que mais recebo é de longe, mas disparado MESMO, quais livros alguém deve seguir para sair do zero e se tornar um cientista de dados. Pensando nisso, resolvi fazer esse post com uma trilha do que considero o ideal para alguém partir do zero e se tornar um cientista de dados. Claro, pode existir um assunto ou outro fora daqui que você pode acabar se deparando quando for efetivamente um profissional da área. Ainda assim, acho que deu para cobrir o essencial. Continuar a ler “Minha Trilha para Se Tornar um Cientista de Dados”

Gráficos com Dois Eixos-Y no Python

Ok, eu acabei de escrever um artigo falando para que você não utilize gráficos com dois eixos-y. Esse uso é desonesto, leva o leitor a interpretar de forma equivocada os dados. Se quiser entender melhor, leia o post O Problema com Dois Eixos-Y. Mas vamos supor que seu chefe mande você fazer isso, ele não se importa com esses problemas. Eu vou te deixar na mão? Claro que não. Abaixo, você encontra os códigos que utilizei para gerar os gráficos do post anterior. Continuar a ler “Gráficos com Dois Eixos-Y no Python”

Livros da Springer disponíveis para download gratuitos

A Springer liberou diversos livros para download em PDF. É uma editora excelente, uma das minhas preferidas junto com a O’Reilly. Vale a pena conferir alguns para Ciência de Dados: Continuar a ler “Livros da Springer disponíveis para download gratuitos”

Tipos de Aprendizado em Machine Learning

Machine Learning, como o próprio nome diz, é sobre aprendizado de máquinas. Mas a máquina não aprende sempre do mesmo jeito. Tal como um ser humano, há formas dela aprender. Aqui, vamos falar dos três tipos de aprendizados existentes: supervisionado, não-supervisionado e semi-supervisionado. Continuar a ler “Tipos de Aprendizado em Machine Learning”

Machine Learning e Data Science, o que é o que aí?

Os termos Machine Learning e Data Science, ou no português Aprendizado de Máquina e Ciência de Dados, estão na moda. Não dá mais para negar o hype. É comum, inclusive, as pessoas fazerem o uso dos dois termos de forma intercambiável. Porém, diferente de muitas coisas que são tratadas como as mesmas, mas com nomes diferentes, creio que aqui exista diferença. Vamos tentar entender o que aborda cada uma dessas áreas. Continuar a ler “Machine Learning e Data Science, o que é o que aí?”