Já fiz um post sobre como fazer uma regressão de diferenças em diferenças em Regressão Diff-In-Diff com Efeitos Fixos no R, porém não falei muito da técnica. Agora, vou passar uma introdução bem tranquila para você entender a intuição por trás dela.
Diferenças em diferenças é uma técnica estatística bastante utilizada em econometria para se analisar, principalmente, o efeito de alguma política que altere o comportamento de um público em determinado momento, em comparação com outro que não fez parte dessa política.
Por exemplo, suponha que em 2015 o prefeito da cidade de São Paulo distribua tablets por todas as escolas, na intenção de que isso aumente a performance dos alunos. Já em 2017, queremos saber se a performance dos alunos melhorou com o uso do tablet. Poderíamos comparar a média dos alunos em 2015 com a média de 2017 para avaliar essa melhora:
Veja que no gráfico com eixo y contendo a média das notas no ENEM e o eixo x contendo o ano da prova, podemos notar que os alunos de São Paulo tiveram uma evolução após a política de uso de tablet. Seria essa evolução causada pelos tablets?
Bem… é possível. Porém, vamos supor que nesse mesmo período, a situação econômica do país tenha mudado, as crianças e adolescentes agora estão em melhores condições, se alimentam melhor. Ou seja, temos uma evolução causada pelo próprio tempo, pelo período transcorrido. A nossa diferença de 20 pontos, que vamos chamar aqui de D1 tem duas componentes então, o programa e o que chamaremos de tendência:
D1 = Programa + Tendência
Não é possível estimar ainda quanto da diferença vem da tendência e quanto vem da política. No entanto, se tivermos uma outra cidade, que também vai sofrer o efeito do tempo, da melhoria geral no país, podemos fazer a comparação. Então, vamos observar a mudança na cidade de Osasco:
Essa mudança na cidade de Osasco muito provavelmente contempla o efeito da tendência, ou seja, esses 17 pontos na média representam a alteração que ocorre por conta da melhoria das condições no país.
Então, para capturar o efeito do programa de tablets, o nosso Diff-In-Diff, bastaria subtrair esse valor que representa a tendência:
DD = D1 – D2
DD = 20 – 17
DD = 3
Outra forma de se calcular o efeito seria tomar a diferença entre as cidades antes do programa e em seguida a diferença após o programa. A diferença entre esses dois valores, representa o efeito da política:
As duas formas chegam no mesmo valor. E essa é a intuição por trás do diff-in-diff!
É possível usar essa técnica de diferenças usando regressão logística? Preciso saber se a probabilidade de um evento ocorrer (0 ou 1) aumentou ou diminuiu após o surgimento de uma lei em 2005.