Correlação Parcial e Semiparcial: Definição e Código SAS

Além da correlação linear comumente utilizada na estatística, duas outras correlações podem ser interessantes para sua análise: parcial e semiparcial. Ambas dizem respeito à associação entre as variáveis, no entanto, agora trabalhamos com a ideia de manter outras variáveis controle constantes. Note que isso é importante, pois havendo uma terceira variável que possa causar interferência nas duas analisadas, teremos uma análise equivocada.

A correlação parcial mede a associação (~correlação) entre duas variáveis, X1 e X2, mantendo uma terceira variável, X3, constante. Sua fórmula é dada a seguir:

onde ‘r’ indica a correlação entre as variáveis subscritas na fórmula.

Você pode encontrar a relação entre o peso e a quantidade de exercícios feitos, mantendo constante a idade. Ou a relação entre o preço da gasolina e do álcool, mantendo constante o preço do diesel ou do açúcar.

A correlação semiparcial mede a associação (~correlação) entre duas variáveis, X1 e X2, mantendo uma terceira variável, X3, constante somente para X1 ou somente para X2. Suas fórmulas – vou inserir uma para cada variável sendo mantida constante – é dada a seguir:

ou

No primeiro caso, mantemos X3 constante para X2, no segundo a mantemos constante para X1.

Não há muito segredo para a sintaxe no SAS. Se quiser calcular a correlação parcial, basta utilizar o PROC CORR com o argumento PARTIAL. No exemplo abaixo, vamos calcular a correlação da variável (=VAR) PESO com (=WITH) QTD_EXERCICIOS, mantendo constante a variável IDADE:

PROC CORR DATA = NOME_DA_TABELA;
 VAR PESO;
 WITH QTD_EXERCICIOS;
 PARTIAL IDADE;
 RUN;

Você vai observar que há uma tabela duas linhas no output. A primeira linha representa a correlação entre as duas variáveis analisadas, mantendo a terceira constante. Já na segunda linha, há um p-valor para testar se o coeficiente é significativamente diferente de zero.

Aparentemente, não há uma função para correlação semiparcial no SAS. Ao menos, não encontrei nenhuma no link do CORR Procedure.

Como alternativa, você pode transpor a fórmula manualmente, criando uma nova função. Ou, trabalhar com o R, que também é um ótimo software estatístico. Utilize o pacote ppcor:

library(ppcor)
with(nome_da_tabela, spcor.test(PESO,QTD_EXERCICIO,IDADE))

Sei que ficou confuso, utilizar dois softwares diferentes. E dessa vez não utilizei uma tabela como exemplo. Mas como tenho tido menos tempo, e ainda assim gostaria de compartilhar esse conhecimento, acabei inserindo o que sei. A biblioteca ppcor também possui função para correlação parcial (pcor.test).

Espero que apesar de tudo isso, o post seja proveitoso. Bons estudos!

4 comentários em “Correlação Parcial e Semiparcial: Definição e Código SAS”

  1. Olá! Adorei a explicaçao do site! Eu faço mestrado na Alemanha em psicologia e as vezes nao entre estatistica em alemão e tentei compreender na minha língua e dei a sorte de encontrar esse site! Obrigada!

  2. Eu fiquei com uma dúvida. Quando você diz de variaveis x1, x2 e x3 existe diferenciaçao entre variavel dependente ( y) e variavel independente ( x) e mais a variavel independente (z) ? Me refiro ao modelo de regressao linear. (SPSS). Obrigada mais uma vez!

    1. Exatamente, seriam duas independentes causando impacto numa terceira. Claro, dependendo da situação, poderia ser duas dependentes que sofrem impacto de uma terceira variável. Mas eu olharia com a mesma visão que você descreveu.

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *