Como é a rotina de um cientista de dados?

Essa pergunta é muito comum. Eu mesmo já fiz algumas vezes em entrevista. Bom, não exatamente ela, mas já perguntei como era a típica rotina do analista da área. É interessante saber exatamente o que é feito. Passam o dia programando? Passam o dia vendo modelos estatísticos? Se você tem essa curiosidade, aqui vai a rotina de um cientista de dados. Claro, a resposta ideal e que realmente serviria era: “depende”. Mas para não ficar em cima do muro, vou tentar encontrar o que seria o mais usual. Continuar a ler “Como é a rotina de um cientista de dados?”

Como fazer um PROCV no Python

Já expliquei essa função outras vezes, mas talvez chamá-la de PROCV (ou VLOOKUP para quem usa Excel em inglês) ajuda as pessoas a compreendê-la. O post de hoje é dedicado a ensinar como fazer a famosa função PROCV do Excel no Python.  Continuar a ler “Como fazer um PROCV no Python”

Memes que Somente Cientistas de Dados Riem

Bom, como ninguém é de ferro, vez ou outra compartilho uns memes bestas no Twitter do EstatSite (@EstatSite). E por que deixar quem acompanha o blog de fora dessa né? Afinal, vocês também podem querer zoar quem usa Excel ao invés do R, quem usa correlação ao invés de modelos que melhor inferem causalidade (como IVs, RDD e Diff-in-Diff), ou quem sabe zoar os usuários de gráficos de pizza, por que não? Continuar a ler “Memes que Somente Cientistas de Dados Riem”

Dicas: Processos Seletivos para Cientistas de Dados

Recentemente, fiz uma breve thread no Twitter com algumas breves dicas para quem vai participar de processos seletivos na área de Cientista de Dados. Não precisa levar como uma verdade absoluta, processos variam de empresa para empresa. Apenas imaginei que poderia ajudar com o que já experienciei sendo candidato e recrutador. Peguei os tweets e compilei aqui, cortando algumas abreviações e aproveitando que aqui desfruto de mais espaço, mas tentando não me alongar demais. Espero que ajude! Continuar a ler “Dicas: Processos Seletivos para Cientistas de Dados”

Tutorial: Limpeza e Análise de Dados com Python

Hoje vamos aprender algumas coisas que podem ser feitas quando se trabalha com dataframes no Python. Como filtrar uma base? Como converter textos para números? Como extrair um valor de moeda no formato texto para o formato numérico? Como obter as estatísticas descritivas?  Como criar novas colunas? Como traçar um histograma? Como localizar valores nulos e preenchê-los com a média da coluna? Tudo isso e muito mais no post abaixo! Continuar a ler “Tutorial: Limpeza e Análise de Dados com Python”

Funções Lambda em Python

Já expliquei como construir uma função em Python no post Construindo Funções em Python. No entanto, Python tem uma função que eu desconhecia até pouco tempo e que tem seu valor, principalmente pela praticidade. Esta nova função, que eu vou explicar neste post, é a chamada função lambdaContinuar a ler “Funções Lambda em Python”

Criando Sequências no Python

Uma coisa geralmente é útil em diversos momentos é criar uma sequência de números. Seja esta sequência somente um índice ou uma sequência com alguma lógica, como uma progressão aritmética ou geométrica, é raro você passar por uma linguagem sem utilizá-las. No Python, isto não é diferente. Por isso, vamos ver alguns exemplos de como construir sequências. Continuar a ler “Criando Sequências no Python”

Python: Tipos de Variáveis e Listas

Como todas as linguagens, Python tem seus tipos de variáveis. A maioria já é conhecida das pessoas (string, numérica, etc.), mas há algumas novidades em termos de listas. Neste post, veremos como identificar o tipo da variável, algumas manipulações simples que podem ser feitas com cada tipo e os diferentes tipos de listas. Continuar a ler “Python: Tipos de Variáveis e Listas”

Uma Brevíssima Introdução ao Anaconda e o Jupyter Notebook

Conforme falei em Primeiros passos em Python, uma opção perfeita para iniciantes no Python é o Anaconda, que possui já integrado nele o Jupyter Notebook e algumas outras ferramentas. Como a plataforma pode ser nova para alguns, vou explicar um pouco sobre como fazer uso dela para programar em Python. É uma brevíssima introdução, bem prática, para que você passe logo pela parte chata e comece a programar. Continuar a ler “Uma Brevíssima Introdução ao Anaconda e o Jupyter Notebook”