Everest Regression

Alguém postou recentemente um comentário sobre Everest Regression no Twitter – não me recordo, mas creio que tenha sido o @lmonasterio. Acabei me recordando desse termo maravilhoso que ouvi somente umas duas vezes, mas que acho bem divertido e interessante. Sendo assim, vamos entender o que ele significa!

Quando trabalhamos com qualquer tipo de modelo, temos o costume de “controlar a regressão para as variáveis….”. O que isso quer dizer é que quando estamos analisando o efeito de uma variável, as demais variáveis envolvidas são levadas em consideração, seus efeitos são considerados na análise. É o caso, por exemplo, de quando fazemos uma regressão porque queremos saber o efeito da variável x1, mas também incluímos na regressão as variáveis x2 e x3 que acreditamos serem relevantes. Isso pode ser feito tanto nos experimentos controlados quanto nos estudos observacionais.

Vamos supor que você queira saber o efeito da meditação no humor das pessoas. Com isso, você vai ou realizar um experimento onde um grupo medite e outro não, ou até mesmo observar pessoas que meditam e as que não meditam. Para ambos os casos, você imagina que a idade também pode influenciar no humor das pessoas, os mais jovens talvez sejam mais bem-humorados (ou não). A profissão também pode influenciar o humor das pessoas, algumas profissões são mais estressantes. Sendo assim, você vai considerar essas variáveis na sua análise para ter certeza de que o que vai alterar o humor é a meditação.

E qual é a da Everest Regression?

Bom, no Everest a temperatura é muito diferente da temperatura a qual estamos acostumados, ao que consideramos temperatura ambiente. Mas imagine que alguém chega a você e diga “controlando para a altura, a temperatura do Everest é igual à da sua sala”. Isso é exatamente o Everest Regression, é quando você usa um modelo para remover uma propriedade relevante, crítica, de uma entidade para depois fazer uma inferência equivocada dessa mesma entidade.

Se você tirar o fator mais importante para responder a questão, é provável que suas inferências venham a ser equivocadas e confusas. Se eu disser que controlando para testosterona, a agressividade de homens e mulheres são iguais, então estou exatamente usando uma Everest Regression, já que a testosterona é um dos hormônios que possuem maior impacto na agressividade – creio eu, se algum médico ver equívoco, eu corrijo o post. Se eu disser que homens não são maiores que as mulheres, controlando para o comprimento do osso, novamente estou usando desse artifício bizarro.

Agora, imagine que eu diga que homens não assistem mais a pornô do que as mulheres. Na verdade, quem assiste mais pornô é quem tem mais desejo sexual. Ou seja, eu controlei a regressão pelo desejo sexual. Ora, mas se homens possuem mais desejo sexual que as mulheres, por conta do seu gênero – já que esse desejo maior é algo biológico – então a afirmação de que homens não assistem mais pornô, controlado pela variável desejo sexual, é só mais uma Everest Regression.

É preciso tomar cuidado com essas variáveis que serão controladas. Algumas podem fazer sentido, mas há casos como esse, em que você vai acabar controlando uma variável crítica para o evento sendo analisado. E a sua descoberta, tal como a de que “homens não assistem a mais pornôs”, vai servir somente para auxiliar a aula de estatística.

Referências:

Real Your Brain on Porn

https://brainslab.wordpress.com/2019/01/20/everest-regression-and-the-effect-of-age-in-alzheimers-disease/

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *