Ciência de Dados em Português por Menos de 30 Reais

Muita gente ingressou nesse mundo de dados este ano. Porém, nem todo mundo encontra tão facilmente materiais e cursos baratos. Os cursos de fora são muito mais baratos, mas nem todo mundo fala inglês bem. Pensando nisso, eu peguei um reply que fiz em um tweet, dei um tapa e montei aqui uma trilha de Ciência de Dados em Português e custando menos de 30 reais! Continuar a ler “Ciência de Dados em Português por Menos de 30 Reais”

Análise de texto usando Python

A análise de texto (~text mining) consiste no processo de obter informações através de dados no formato de um texto. Por se tratar de dados não-estruturados, a limpeza e tratativa é parte relevante e pouco trivial do processo. Falei brevemente de text mining no post Introdução ao Text Mining com Python. Hoje, volto ao tema utilizando uma biblioteca que me deixou bastante surpreso com seu poder de análise: a texthero! Continuar a ler “Análise de texto usando Python”

Análise exploratória SUPER-fácil no Python!

Fazer gráficos no Python não é a coisa mais fácil do mundo. Não que seja mega difícil, mas não é tão trivial. Construir dashboards menos ainda. Bom, era até um tempo atrás. Hoje você vai aprender sobre uma biblioteca no Python capaz de construir dashboards com apenas UMA linha de código. Continuar a ler “Análise exploratória SUPER-fácil no Python!”

Como começar na área de Ciência de Dados?

Como entrar na área de ciência de dados sem ter experiência é provavelmente a pergunta que mais recebo na DM. Sempre respondo com prazer porque sei como é difícil para quem é jovem e está atrás do primeiro estágio ou quem já é mais velho e está em transição. Pensando nisso, fiz uma thread com algumas dicas, coisas que chamariam a atenção minha e de meus colegas quando precisamos trazer alguém para o time. Peço que perdoem as abreviações, no Twitter precisamos economizar caracteres e isso aqui é só um copia e cola da thread. Continuar a ler “Como começar na área de Ciência de Dados?”

Trilha para Data Science em R (Springer)

Como vocês já sabem, a Springer disponibilizou diversos livros gratuitos. Dentre eles, há vários que podem ser utilizados para aprender mais sobre Ciência de Dados (separei alguns no post Livros da Springer – Gratuitos). Aqui, separei uma trilha de Data Science em R somente utilizando os livros disponibilizados por eles: Continuar a ler “Trilha para Data Science em R (Springer)”

Livros da Springer disponíveis para download gratuitos

A Springer liberou diversos livros para download em PDF. É uma editora excelente, uma das minhas preferidas junto com a O’Reilly. Vale a pena conferir alguns para Ciência de Dados: Continuar a ler “Livros da Springer disponíveis para download gratuitos”

Tipos de Aprendizado em Machine Learning

Machine Learning, como o próprio nome diz, é sobre aprendizado de máquinas. Mas a máquina não aprende sempre do mesmo jeito. Tal como um ser humano, há formas dela aprender. Aqui, vamos falar dos três tipos de aprendizados existentes: supervisionado, não-supervisionado e semi-supervisionado. Continuar a ler “Tipos de Aprendizado em Machine Learning”

Machine Learning e Data Science, o que é o que aí?

Os termos Machine Learning e Data Science, ou no português Aprendizado de Máquina e Ciência de Dados, estão na moda. Não dá mais para negar o hype. É comum, inclusive, as pessoas fazerem o uso dos dois termos de forma intercambiável. Porém, diferente de muitas coisas que são tratadas como as mesmas, mas com nomes diferentes, creio que aqui exista diferença. Vamos tentar entender o que aborda cada uma dessas áreas. Continuar a ler “Machine Learning e Data Science, o que é o que aí?”

Mulheres de Ciência de Dados para Seguir

Aproveitando o dia, vou deixar uma singela recomendação de algumas mulheres de #DATA incríveis que vocês deveriam acompanhar o trabalho. Busquem na rede social de preferência (eu sei que no Twitter e Linkedin elas estão todas): Continuar a ler “Mulheres de Ciência de Dados para Seguir”