No post A estrutura dos dados em Econometria acabei me esquecendo dos dados em Pooled Cross-Section – algo como Corte Transversal Agrupado. Essa estrutura é um meio termo entre Cross-Section e Painel. Continuar a ler “Estrutura de Dados em Econometria (II)”
Categoria: Ciência de Dados
Conteúdo sobre ciência de dados
Artigos que utilizam o Diff-in-Diff
Falei pouco sobre Diff-in-Diff aqui, somente nos posts Regressão Diff-In-Diff com Efeitos Fixos no R e Diferenças em Diferenças (Diff-in-Diff). Porém, é um modelo muito interessante para quem vai fazer pesquisa, principalmente quando se avalia políticas públicas. Continuar a ler “Artigos que utilizam o Diff-in-Diff”
Artigo Científico sobre Experimentos Aleatórios Controlados
No meu texto de segunda feira escrito para o Portal Deviante, chamado Qual o tamanho da influência de seus amigos?, mencionei um ótimo artigo para quem quer estudar RCT (Randomized Controlled Trials). O artigo se chama How Does Peer Pressure Affect Educational Investments e é altamente recomendável para quem está estudando a matéria. Leia o meu texto e as indicações ao final dele!
Abraços!
Um exemplo prático de Viés de Seleção
Errar na hora de selecionar a amostra de um estudo pode causar vários problemas no experimento. Escrevi recentemente um texto no Portal Deviante sobre o assunto. Para ler clique no link: Amostra que perde guerra!
Leia também: Viés de Seleção: Seus resultados podem estar te enganando
Séries Temporais: Gráficos para Sazonalidade
Além da decomposição apresentada no post Séries Temporais: Introdução e Decomposição dos Componentes em R, há outras formas de se visualizar a sazonalidade da série. A série utilizada aqui é a a10 do pacote fpp. Ela contém as informações de venda de antibióticos na Austrália no período de 1991 a 2008.
Viés de Variável Omitida: Prova Matemática
Já expliquei o conceito de Omitted Variable Bias em Viés de Variável Omitida: Um exemplo prático. Agora, vou deixar aqui a “prova” matemática do problema. Isto é, o que acontece com nosso estimador quando deixamos de incluir uma variável relevante no modelo. Há bastantes rasuras. Pode me escrever se não entender – ou se achar que tem algum erro.
Experimentos Naturais (Texto no Portal Deviante)
Se você quer saber o efeito de uma droga, mesmo sem ser médico você tem uma ideia básica de como funcionará o experimento: selecionar n indivíduos, para alguns dar a droga e para outros não. Um tempo depois você analisa a diferença entre os que utilizaram a droga e os que não a utilizaram e esse é o efeito procurado.
Como ter um modelo overfitted/sobreajustado?
Fez um modelo com preditores complexos e o treinou com poucos exemplos? Mudou a questão inicial para dar uma tunada nos indicadores?
Leia mais…
Linearidade nos Parâmetros
Uma das premissas do método de mínimos quadrados para regressão linear é a linearidade dos parâmetros. Algumas pessoas confundem o que é linearidade nos parâmetros. Então, para ficar bem claro, veja os exemplos a seguir:
Causalidade Reversa
Um dos maiores cuidados que devemos ter ao elaborarmos um experimento, um RCT (randomized controlled trial), é a causalidade reversa.
Causalidade reversa se refere à inversão da direção causa-efeito em um experimento. Isto é, ocorre quando há confusão entre o que é a causa e o que é o efeito. Os modelos estatísticos servem para dizer que X causa Y, porém, quando há causalidade reversa, o autor corre o risco de concluir que Y causa X.