Erros vs. Resíduos

É comum cometermos o equívoco de chamar erros de resíduos e vice-versa. A definição é próxima mesmo, então não se preocupe se você já cometeu esse erro. Enfim, qual a diferença entre o que chamamos de erros e dos chamados resíduos?

O erro é a diferença entre o valor real, que não observamos, e o valor estimado. Já o resíduo é a diferença entre o valor estimado e o valor observado.

Confuso? Eu sempre achei, então vamos tentar de novo.

Quando realizamos nossa regressão, estamos tentando estimar uma reta que melhor se aproxima do conjunto de pontos que temos observado, mas nós nunca sabemos qual é a reta real que explicaria esse conjunto de pontos. O que nós conseguimos é uma estimativa dessa reta.

Vamos supor que tenhamos uma população onde o peso médio é 70kg e temos um indivíduo retirado aleatoriamente dessa população que pesa 65kg. Então o erro desse indivíduo é -5kg.

Em contrapartida, quando falamos de resíduos, estamos buscando uma estimativa do erro não observado. Nesse caso, estamos falando, por exemplo, de retirar uma amostra aleatória de uma população e tiramos a média amostral. A diferença entre a média amostral e algum indivíduo retirado dela, isso sim é o resíduo!

Facilitou?

8 comentários em “Erros vs. Resíduos”

  1. Na verdade, o termo de erro contem todos os demais fatores não incluídos na regressão (fatores além do conjunto xi de variáveis independentes que afetam o seu y, variável dependente). O resíduo é a diferença entre o valor observado e o valor ajustado.

    1. Oi Jéssica. Obrigado por agregar com o comentário.
      Concordo com o que você disse, mas isso não muda o post. Justamente por conter os fatores omitidos (com algumas restrições consideradas nas premissas dos modelos) é que se trataria da diferença do valor real.
      Aproveitando esse comentário, vou deixar alguns links relacionados também:
      Wikipedia: Errors and Residuals
      Stats Exchange: What’s the difference between errors and residuals?
      What is the Error Term in a Regression Equation? by David A Freedman
      Phil Chan Youtube Video: Difference between the error term, and residual in regression models

    1. Os pressupostos deveriam ser para os erros, porém nós não conseguimos observar os erros. Sendo assim, trabalhamos nossas hipóteses com os resíduos mesmo.

    1. Olá, Carlos.
      Não sei qual o contexto (às vezes os materiais misturam alguns termos), mas acredito que se refira ao que defini como resíduo. Segundo o Minitab.com, Erro Residual é “a variabilidade que permanece depois de identificados todos os efeitos principais e interações.”
      Abs!

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *