Complementando o post Análise Bidimensional para Variáveis Qualitativas, vamos entender agora uma medida quantitativa para entender como duas variáveis qualitativas se relacionam entre si.
Vamos utilizar os mesmos dados hipotéticos que relacionam sexo e tipo de curso superior escolhido:
Veja que a distribuição de sexo é de aproximadamente 58% masculino e 42% feminino. Como temos 665 indivíduos que irão cursar exatas, o esperado é que 384 (58%*665) indivíduos fossem do sexo masculino e os outros 281 (42%*665) fossem do sexo feminino. Sendo assim, temos um desvio do valor esperado.
Olhe intuitivamente! Se não tivéssemos nenhum desvio, as variáveis sexo e faculdade não teriam nenhuma dependência (leia novamente o trecho que fala sobre associação entre variáveis). É de se esperar então que quanto maior o desvio, maior a dependência entre as duas variáveis qualitativas consideradas. Ou seja, implica uma relação entre as duas, implica que a partir do sexo você já tem uma ideia do curso que a pessoa optou.
Então, sendo repetitivo novamente, verificamos o valor esperado e o quanto as distribuições desviam desse valor:
O qui-quadrado de pearson consiste em obter o quadrado de cada célula acima dividido pelo respectivo valor esperado e fazer a somatória:
No nosso caso, teremos como resultado: 11,5+11,4+15,7+15,5 = 54,2.
Uma crítica comum é que esse teste não fornece claramente a força da dependência entre duas variáveis, e sim, a existência dessa dependência.
Por isso, temos o coeficiente de contingência de Pearson, dado por:
Com isso, chegamos então ao valor de 0,19, o que indica uma baixa associação (isso se eu não errei nenhuma conta ao longo desse material).
Atenção: Em alguns casos, principalmente na literatura estrangeira, é possível encontrar o coeficiente com outra letra – já encontrei como T.
Nota: É interessante também a leitura a respeito do coeficiente Phi, embora você já consiga se virar bem com o coeficiente de Pearson e as análises das distribuições.
Na na fórmula do coeficiente de contingência, pelo resultado obtido, faltou adicionar o k,
onde a raiz quadrada de k/k-1 é multiplicada pelo resultado da raiz anterior