Artigo utilizando modelos em painel e text mining

Escrevi um texto para o portal deviante falando sobre um dos artigos mais legais de economia que li no ano passado. Além do considerável impacto social do tema, me chamou a atenção ver a autora utilizar text mining – além de outras técnicas estatísticas, como modelos em painel. Fica aí o link do meu texto para quem se interessar: Igualdade de Gênero no Mundo Acadêmico. Nele faço referência ao artigo e também a um bom livro chamado “The Why Axis: Hidden Motives and the Undiscovered Economics”, que é de economia, mas uma boa leitura para qualquer um envolvido em análise de dados.

Leia também:
Diferenças em Diferenças (Diff-in-Diff)
Regressão Diff-In-Diff com Efeitos Fixos no R

Introdução ao SQL

SQL (Structured Query Language) é a linguagem padrão utilizada para armazenar, manipular e recuperar informações de bancos de dados. Colocando de forma simples, é através do SQL que é possível criar e atualizar nossos dados através de um modelo relacional. Os maiores usuários da linguagem são os DBAs (Database Administrators), responsáveis por toda a gestão dos dados, desde criar tabelas até dar acesso às demais áreas (para os mais curiosos há um podcast brasileiro com foco nos DBAs chamado DatabaseCast).

Leia mais…

Podcasts

Você pega trânsito no trabalho? Já cansou dos programas de rádio? Quer fazer algo mais produtivo com esse tempo? Que tal tentar um podcast?

Fiz uma pequena lista de programas falando sobre estatística:

Podcasts que falam sobre Estatística

PS.: Depois de ouvir os programas sobre estatística, dê uma chance a essa mídia. Recomendo o Scicast e o Dragões de Garagem para quem gosta de ciência!

Getting back in the game

Ainda longe de estar totalmente recuperado, mas já apto a escrever um pouco vou usar o tempo que o médico liberou para escrever um pouco aqui… Hoje já consegui escrever dois posts curtinhos e uma introdução ao Python para quem quer aprender essa ferramenta bacana.

Spoiler alert: qualquer um que queira ser um data scientist vai ter que aprender python!

Bons estudos!

Causalidade Reversa

Um dos maiores cuidados que devemos ter ao elaborarmos um experimento, um RCT (randomized controlled trial), é a causalidade reversa.

Causalidade reversa se refere à inversão da direção causa-efeito em um experimento. Isto é, ocorre quando há confusão entre o que é a causa e o que é o efeito. Os modelos estatísticos servem para dizer que X causa Y, porém, quando há causalidade reversa, o autor corre o risco de concluir que Y causa X.

Leia mais…

É hora de tirar a média das suas análises?

A média é a medida mais utilizada da estatística descritiva. O que muita gente não sabe, é que essa medida é amplamente questionada, principalmente pelos próprios estatísticos, que hoje em dia dificilmente a utilizam como um valor relevante para descrever dados e extrair insights.

Leia mais…