Datasets para Praticar Modelos de Machine Learning

Você estuda, estuda, estuda, e estuda um pouco mais, mas é isso. Lê livros, vê vídeos no Youtube, mas permanece somente na teoria. Chega uma hora que você precisa colocar seu conhecimento em prática. Aplicar Árvore de Decisão, Random Forest, Regressão Linear, Regressão Logística e por aí vai. Abaixo, uma lista de datasets populares e quais técnicas você pode testar neles. Continuar a ler “Datasets para Praticar Modelos de Machine Learning”

Trilha para Data Science em R (Springer)

Como vocês já sabem, a Springer disponibilizou diversos livros gratuitos. Dentre eles, há vários que podem ser utilizados para aprender mais sobre Ciência de Dados (separei alguns no post Livros da Springer – Gratuitos). Aqui, separei uma trilha de Data Science em R somente utilizando os livros disponibilizados por eles: Continuar a ler “Trilha para Data Science em R (Springer)”

Minha Trilha para Se Tornar um Cientista de Dados

A pergunta que mais recebo é de longe, mas disparado MESMO, quais livros alguém deve seguir para sair do zero e se tornar um cientista de dados. Pensando nisso, resolvi fazer esse post com uma trilha do que considero o ideal para alguém partir do zero e se tornar um cientista de dados. Claro, pode existir um assunto ou outro fora daqui que você pode acabar se deparando quando for efetivamente um profissional da área. Ainda assim, acho que deu para cobrir o essencial. Continuar a ler “Minha Trilha para Se Tornar um Cientista de Dados”

O Problema dos Gráficos com Dois Eixos-Y

Gráficos com dois eixos-y são constantemente criticados por estatísticos e economistas, ao menos entre os mais experientes com análise exploratória. Para os leigos ou com pouco contato com esse tipo de análise é meio estranho essa implicância. Mas acredite em mim, não é em vão. Continuar a ler “O Problema dos Gráficos com Dois Eixos-Y”

Livros da Springer disponíveis para download gratuitos

A Springer liberou diversos livros para download em PDF. É uma editora excelente, uma das minhas preferidas junto com a O’Reilly. Vale a pena conferir alguns para Ciência de Dados: Continuar a ler “Livros da Springer disponíveis para download gratuitos”

Tipos de Aprendizado em Machine Learning

Machine Learning, como o próprio nome diz, é sobre aprendizado de máquinas. Mas a máquina não aprende sempre do mesmo jeito. Tal como um ser humano, há formas dela aprender. Aqui, vamos falar dos três tipos de aprendizados existentes: supervisionado, não-supervisionado e semi-supervisionado. Continuar a ler “Tipos de Aprendizado em Machine Learning”

Machine Learning e Data Science, o que é o que aí?

Os termos Machine Learning e Data Science, ou no português Aprendizado de Máquina e Ciência de Dados, estão na moda. Não dá mais para negar o hype. É comum, inclusive, as pessoas fazerem o uso dos dois termos de forma intercambiável. Porém, diferente de muitas coisas que são tratadas como as mesmas, mas com nomes diferentes, creio que aqui exista diferença. Vamos tentar entender o que aborda cada uma dessas áreas. Continuar a ler “Machine Learning e Data Science, o que é o que aí?”

Como fazer um PROCV no Python

Já expliquei essa função outras vezes, mas talvez chamá-la de PROCV (ou VLOOKUP para quem usa Excel em inglês) ajuda as pessoas a compreendê-la. O post de hoje é dedicado a ensinar como fazer a famosa função PROCV do Excel no Python.  Continuar a ler “Como fazer um PROCV no Python”

Como Big Data Explica Freud?

Freud é um nome muito conhecido. Mais comum para filósofos e psicólogos, ele aparece constantemente em papos não-acadêmicos. Mesmo conhecido por todos, explicar suas ideias é algo mais complicado. Suas teorias sempre foram muito intrigantes, capazes de gerar muitas dúvidas e ceticismo. Costumeiramente, mexe com algo mais profundo e, por vezes, intangível. Tanto é que subconsciência é uma palavra que aparece quase sempre que se fala de suas principais teorias. Bem, mas se suas ideias são baseadas em coisas que não estão na nossa consciência, cabe a nós aceitá-las e ponto final. Não tem como provar que elas são falsas ou verdadeiras, certo? Ou será que tem? Continuar a ler “Como Big Data Explica Freud?”