Quando falamos de Machine Learning, estamos falando de “máquinas que aprendem”, como o próprio nome já diz. Porém, há várias formas das máquinas aprenderem, diversos tipos de algoritmo. Fazemos essa distinção através do que chamamos de tipos de aprendizado em Machine Learning. O aprendizado pode ser supervisionado, não-supervisionado e semi-supervisionado. Abaixo, as explicações de cada um deles. Continuar a ler “Tipos de Aprendizado em Machine Learning”
9 Apps para Cientistas de Dados
Nem tudo que a gente consome precisa estar diretamente ligado à programação. Como todo profissional, o cientista de dados precisa estudar, ter foco, ser produtivo, dentre outras coisas. Pensando nisso, fiz uma lista contendo 9 apps para cientistas de dados, misturando conteúdos de programação e data science com produtividade e estudos de um modo geral. Continuar a ler “9 Apps para Cientistas de Dados”
Ciência de Dados em Português por Menos de 30 Reais
Muita gente ingressou nesse mundo de dados este ano. Porém, nem todo mundo encontra tão facilmente materiais e cursos baratos. Os cursos de fora são muito mais baratos, mas nem todo mundo fala inglês bem. Pensando nisso, eu peguei um reply que fiz em um tweet, dei um tapa e montei aqui uma trilha de Ciência de Dados em Português e custando menos de 30 reais! Continuar a ler “Ciência de Dados em Português por Menos de 30 Reais”
Análise de dados em Python sem programação
Você provavelmente já deve ter notado que as ferramentas low code estão se multiplicando. Existem bibliotecas de Auto-ML e Auto-EDA, as nuvens já possuem suas próprias tecnologias, grandes empresas com H2o criando ferramentas o tempo todo, e por aí vai. E na linguagem dominante no mercado de Data Science, isso também é realidade. Hoje, vamos ver como fazer uma análise de dados em Python sem programação! Continuar a ler “Análise de dados em Python sem programação”
IGTV: Legalização da Cannabis x Fatalidades no Trânsito
Vídeo do IGTV: https://www.instagram.com/p/CU-zbVWJ0rV/
Fontes Citadas:
- Como a legalização da cannabis impacta em fatalidades no trânsito: https://www.econstor.eu/bitstream/10419/58536/1/690072864.pdf
- Como a legalização da cannabis impacta o consumo de drogas mais pesadas: https://www.jstor.org/stable/10.1086/684043
- Diferenças-em-Diferenças: Diferenças em Diferenças (Diff-in-Diff)
IGTV: Instagram x Body Shaming
VÍDEO DO IGTV:
FONTES CITADAS:
- Vazamento do estudo feito pelo próprio Facebook, apontando que o Instagram afeta nossa autoestima: https://www.wsj.com/articles/facebook-knows-instagram-is-toxic-for-teen-girls-company-documents-show-11631620739
- Estudo com estudantes, mostrando que apenas 7 minutos utilizando a rede social pode ter um efeito negativo na usuária: https://pubmed.ncbi.nlm.nih.gov/32505866/
- Estudo mostrando o efeito de olhar “corpos perfeitos” e as curtidas: https://pubmed.ncbi.nlm.nih.gov/30036748/
- Estudo com efeitos do conteúdo “body positive”: https://journals.sagepub.com/doi/10.1177/1461444819826530
- Outros estudos:
- Thread no Twitter com o resumo destes papers: https://mobile.twitter.com/Unidosdados/status/1447934196798853120
3 Funcionalidades Incríveis do IPython
Nem todo mundo conhece, mas o IPython é uma “iteractive shell” (shell iterativo?), uma forma de adicionar funcionalidades ao nosso programa muito útil. A ideia vai um pouco além disso e você pode explorar um pouco mais indo neste link, mas para nós, vale apenas pensar como se fosse um pacote diferentão que vai trazer features para facilitar nosso trabalho, como mostrar vários outputs de uma célula ou colocar uma música no fim da execução de um trecho do código. Enfim, bora conhecer 3 funcionalidades incríveis do IPython hoje! Vamo que vamo! Continuar a ler “3 Funcionalidades Incríveis do IPython”
Como ler arquivos pdf no Python e no R
Sempre que estudamos data science, uma das primeiras coisas que aprendemos é como importar arquivos no programa que você estiver usando. Quem nunca precisou de um pd.read_csv(), no Python, ou um fread(), no R, que atire a primeira pedra. A questão é que nem sempre temos csv, às vezes queremos, por exemplo, ler um pdf. E é exatamente isso que vamos ver hoje: como ler arquivos pdf no Python e no R! Continuar a ler “Como ler arquivos pdf no Python e no R”
Testando VÁRIOS modelos numa tacada só no Python!
Eu já mostrei uma vez como testar diversos algoritmos numa tacada só no Python utilizando um simples loop e o pipeline do Scikit-Learn. Hoje, descobri outra coisa interessante, que já há um pacote que faz isso. É menos flexível do que a ideia que eu usava, mas é muito prático, afinal, você vai estar testando vários modelos numa tacada só – no Python, claro! Isso mesmo, mais de 20 modelos com somente 3 linhas de código. Bora aprender como fazer isso! Continuar a ler “Testando VÁRIOS modelos numa tacada só no Python!”
Os melhores blogs de ciência de dados
Recomendações de fontes de estudos é sempre algo muito legal. Recentemente, indiquei alguns livros online gratuitos e a galera curtiu bastante. Agora, vamos focar nos blogs. E vamos de título clichê por falta de criatividade: os melhores blogs de ciência de dados! Continuar a ler “Os melhores blogs de ciência de dados”