Artigo utilizando modelos em painel e text mining

Escrevi um texto para o portal deviante falando sobre um dos artigos mais legais de economia que li no ano passado. Além do considerável impacto social do tema, me chamou a atenção ver a autora utilizar text mining – além de outras técnicas estatísticas, como modelos em painel. Fica aí o link do meu texto para quem se interessar: Igualdade de Gênero no Mundo Acadêmico. Nele faço referência ao artigo e também a um bom livro chamado “The Why Axis: Hidden Motives and the Undiscovered Economics”, que é de economia, mas uma boa leitura para qualquer um envolvido em análise de dados.

Leia também:
Diferenças em Diferenças (Diff-in-Diff)
Regressão Diff-In-Diff com Efeitos Fixos no R

Séries Temporais: Gráficos para Sazonalidade

Além da decomposição apresentada no post Séries Temporais: Introdução e Decomposição dos Componentes em R, há outras formas de se visualizar a sazonalidade da série. A série utilizada aqui é a a10 do pacote fpp. Ela contém as informações de venda de antibióticos na Austrália no período de 1991 a 2008.

Leia mais…

Gerar uma amostra aleatória simples no R

Para gerar uma amostra aleatória simples no R a partir de um conjunto de dados que você possui, o modo mais fácil é com a função sample() já apresentada aqui no post Como gerar números aleatórios no R?. A única diferença é que será necessário colocar como primeiro argumento o vetor em questão:

Leia mais…

Introdução ao SQL

SQL (Structured Query Language) é a linguagem padrão utilizada para armazenar, manipular e recuperar informações de bancos de dados. Colocando de forma simples, é através do SQL que é possível criar e atualizar nossos dados através de um modelo relacional. Os maiores usuários da linguagem são os DBAs (Database Administrators), responsáveis por toda a gestão dos dados, desde criar tabelas até dar acesso às demais áreas (para os mais curiosos há um podcast brasileiro com foco nos DBAs chamado DatabaseCast).

Leia mais…

Viés de Variável Omitida: Prova Matemática

Já expliquei o conceito de Omitted Variable Bias em Viés de Variável Omitida: Um exemplo prático. Agora, vou deixar aqui a “prova” matemática do problema. Isto é, o que acontece com nosso estimador quando deixamos de incluir uma variável relevante no modelo. Há bastantes rasuras. Pode me escrever se não entender – ou se achar que tem algum erro.

Leia mais…

Teorema de Bayes na Prática

Já expliquei sobre o Teorema de Bayes algumas vezes (Teorema de Bayes na prática: interpretando falso positivo e Probabilidade Condicional e o Teorema de Bayes). Para complementar o conteúdo, escrevi um texto no Portal Deviante com um pouco mais de contexto sobre o assunto, num tom bem informal: Deu positivo, mas tô de boa porque aprendi Bayes

Experimentos Naturais (Texto no Portal Deviante)

Se você quer saber o efeito de uma droga, mesmo sem ser médico você tem uma ideia básica de como funcionará o experimento: selecionar n indivíduos, para alguns dar a droga e para outros não. Um tempo depois você analisa a diferença entre os que utilizaram a droga e os que não a utilizaram e esse é o efeito procurado.

Leia mais…