Ciência de Dados em Português por Menos de 30 Reais

Muita gente ingressou nesse mundo de dados este ano. Porém, nem todo mundo encontra tão facilmente materiais e cursos baratos. Os cursos de fora são muito mais baratos, mas nem todo mundo fala inglês bem. Pensando nisso, eu peguei um reply que fiz em um tweet, dei um tapa e montei aqui uma trilha de Ciência de Dados em Português e custando menos de 30 reais! Continuar a ler “Ciência de Dados em Português por Menos de 30 Reais”

Análise de dados em Python sem programação

Você provavelmente já deve ter notado que as ferramentas low code estão se multiplicando. Existem bibliotecas de Auto-ML e Auto-EDA, as nuvens já possuem suas próprias tecnologias, grandes empresas com H2o criando ferramentas o tempo todo, e por aí vai. E na linguagem dominante no mercado de Data Science, isso também é realidade. Hoje, vamos ver como fazer uma análise de dados em Python sem programação! Continuar a ler “Análise de dados em Python sem programação”

3 Funcionalidades Incríveis do IPython

Nem todo mundo conhece, mas o IPython é uma “iteractive shell” (shell iterativo?), uma forma de adicionar funcionalidades ao nosso programa muito útil. A ideia vai um pouco além disso e você pode explorar um pouco mais indo neste link, mas para nós, vale apenas pensar como se fosse um pacote diferentão que vai trazer features para facilitar nosso trabalho, como mostrar vários outputs de uma célula ou colocar uma música no fim da execução de um trecho do código. Enfim, bora conhecer 3 funcionalidades incríveis do IPython hoje! Vamo que vamo! Continuar a ler “3 Funcionalidades Incríveis do IPython”

Como ler arquivos pdf no Python e no R

Sempre que estudamos data science, uma das primeiras coisas que aprendemos é como importar arquivos no programa que você estiver usando. Quem nunca precisou de um pd.read_csv(), no Python, ou um fread(), no R, que atire a primeira pedra. A questão é que nem sempre temos csv, às vezes queremos, por exemplo, ler um pdf. E é exatamente isso que vamos ver hoje: como ler arquivos pdf no Python e no R! Continuar a ler “Como ler arquivos pdf no Python e no R”

Modelo de Classificação de Estilo Musical

Recentemente, fiz um dos projetos disponíveis na plataforma do Datacamp – tenho uma assinatura anual que fiz no início da pandemia. A ideia era criar um modelo que classificasse o estilo musical com base em algumas características da música. Este post é dedicado a explicar um pouco do código e dar uma base com outros posts para que você consiga acompanhar o conteúdo dele. Enfim, bora aprender um modelo legal de classificação de estilo musical em Python! Continuar a ler “Modelo de Classificação de Estilo Musical”

Como fazer procv – e outros JOINs – no Python

Novamente, um post tentando ajudar a galera que está migrando de Excel para Python. Mais especificamente, aqueles que estão apanhando tentando juntar diferentes datasets, trazer informação de outras bases para uma principal e coisas do tipo. Hoje, você vai aprender como fazer PROCV – função clássica do Excel – e outros joins no Python. Além, claro, de outras formas de fazer join! Bora lá! Continuar a ler “Como fazer procv – e outros JOINs – no Python”

Calculadora de juros compostos em Python

Já está ficando repetitivo eu dizer que gostaria de trazer abordagens que são menos conectadas às tarefas de cientistas de dados. Mas, mais uma vez, esse é o intuito do post. Da última vez que abordei a temática, falei de uma tarefa bastante comum em cursos de programação, a de criar um conversor de decimal para binário. Agora, vamos para outra tarefa comum, mas mais nos cursos de finanças: criar uma calculadora de juros compostos em Python! Continuar a ler “Calculadora de juros compostos em Python”

Analisando os dados do Instagram com Python

O mais legal de trabalhar com análise de dados é que você pode analisar absolutamente TUDO que você quiser. Já analisei dados do Twitter no post Analisando o Twitter com o R, já me aventurei em dados ambientais (mencionei neste tweet aqui) e, agora, resolvi abrir os dados do Instagram. Se você quer saber como andam seus likes, quem comenta suas fotos, pare de pagar aqueles apps que fazem isso e rode você mesmo um script que traga tudo isso! Continuar a ler “Analisando os dados do Instagram com Python”

XGBoost em Python

Hoje é dia de seguir com a minha promessa de abordar mais Machine Learning em Python, algo que acabei negligenciando nos últimos meses. Dessa vez, você vai aprender como rodar um XGBoost em Python. Tal qual ocorreu em Regressão Logística em Python e Random Forest em Python, a ideia é você ter um esqueleto para apenas inserir seu dataset e correr para o abraço. Vamos lá! Continuar a ler “XGBoost em Python”

Calculando o tempo de execução em Python e R

Saber quanto tempo seu script está demorando para ser executado pode ser muito útil. Seja porque você está querendo melhorar o código e quer fazer comparações, ou porque algum processo é demorado e você quer mensurar seu tempo de execução, saber obter este tempo é sempre vantajoso. Sendo assim, hoje vamos aprender como calcular o tempo da execução de um script tanto em Python quanto em R. Continuar a ler “Calculando o tempo de execução em Python e R”