Correlação e Causa: O Caso da Regressão Linear

Que correlação não implica causa já é algo que está ficando cada vez mais manjado. Não é mais necessário ser um estatístico ou economista para saber isso. Baste um pouco de conhecimento em análise de dados. O curioso é que para muitas pessoas, isso pode ser resolvido com uma regressão linear. Não é verdade.

Tal qual a correlação, a regressão linear não é capaz de inferir causa. Sim, por mais que você esteja trabalhando com diversas variáveis, por mais que seja algo bem mais trabalhoso que um mero coeficiente de Pearson, a regressão linear ainda não é suficiente para que possamos afirmar com certeza que estamos vendo uma relação de causa.

Em primeiro lugar, é importante ter em mente que para que se possa falar de causalidade, precisamos tratar de um experimento controlado – o popular RCT (Randomized Controlled Trial) – ou um experimento natural. O segundo é obtido quando temos um choque exógeno. Em outras palavras, precisamos de um evento imprevisível/inesperado que afete a economia, o ambiente em questão.

Quando um economista avalia o impacto da polícia na criminalidade, utilizando o aumento policial em decorrência de um atentado terrorista, ele está trabalhando com o choque exógeno do atentado. Quando o banco central injeta dinheiro de forma inesperada, temos um choque na política fiscal, seja o aumento de gastos ou de taxação. Esse tipo de evento serve para que pesquisadores simulem experimentos controlados.

Agora, é claro que apesar disso você sabe que regressão linear e correlação não são exatamente iguais. As principais diferenças são:

  • Na regressão linear, nós temos o intercepto. Esse valor, também chamado de beta zero, representa o valor da variável dependente para quando a variável independente for zero.
  • Na regressão linear, temos a inclinação (beta um, dois, três, etc.). Esse valor representa a variação marginal na variável de saída / destino, alterando a variável independente pela distância unitária.
  • É possível fazer previsões com a regressão linear, dadas as devidas variáveis de entrada – i.e., valores para as variáveis independentes.

E você pode ler ainda os seguintes posts para se aprofundar no tema:

Para que serve e como funciona a variável instrumental?

Avaliando intervenções: Variáveis Instrumentais

Correlação / Causalidade + RDD: Educação Impacta na Criminalidade?

Gostou do conteúdo? Se inscreva para receber as novidades! Deixe seu e-mail em INSCREVA-SE na barra à direita, logo abaixo de pesquisar. E, por favor, não deixe de comentar, dar seu feedback e compartilhar com seus amigos. De verdade, isso faz toda a diferença. Você também pode acompanhar mais do meu trabalho seguindo a conta de Twitter @EstatSite ou por alguma das redes que você encontra em Sobre o Estatsite / Contato.

Bons estudos!

2 comentários em “Correlação e Causa: O Caso da Regressão Linear”

  1. Olá!

    Muito boa a sua colocação, de fato, muitos não atentam para essa questão de causa e efeito.
    Este post me fez lembrar o material escrito pela Profa. Carla Vivacqua e pelo Prof. André Pinho, ambos da UFRN, trata num primeiro momento sobre esse assunto chamando a atenção dos alunos.
    Uma relação observada entre duas variáveis não implica estabelecer uma relação de causa e efeito, isto é, que uma esteja causando mudança na outra (Pinho, 2008).
    Exemplo: Dados referentes aos anos de 1930-1936. Gráfico da população de Oldenburg-Alemanha ao final de cada ano versus o número de cegonhas.

    1. Exatamente, Fábio! Mas até mais do que isso, temos que nos atentar que alguns modelos mais robustos não são tão perfeitos para inferir causa. São melhores que uma correlação de Pearson, por exemplo, mas ainda capturam apenas correlações.
      E valeu pelo exemplo, esse é novo pra mim!

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *