Assim como podemos analisar bidimensionalmente variáveis quantitativas, podemos analisar variáveis qualitativas. Neste caso, ao invés de querer saber a relação entre duas quantidades, queremos saber a relação de duas categorias / características. Por exemplo, você pode estar interessado em saber a relação entre o grau de instrução do indivíduo e o sexo, cuja distribuição é apresentada na tabela abaixo:
Uma forma de se analisar, é observando como estão distribuídos esses indivíduos de forma geral. Por exemplo, qual a porcentagem da população que é analfabeto e do sexo masculino?
Ou seja, analisamos qual % de cada par de grau de instrução e sexo com relação ao total:
Ou então, podemos verificar dentro de cada subgrupo de sexo qual a distribuição do grau de instrução:
Isso é facilmente construído no Excel com uma tabela dinâmica, onde você pode também obter a distribuição por subgrupo de grau de instrução. E observar, por exemplo, que dentre os analfabetos, 47% são do sexo masculino (3.453.934/7.297.008) e 53% são do sexo feminino (3.843.074/7.297.008).
Essas distribuições são utilizadas principalmente para entender a associação entre as variáveis. Veja que independente do sexo, 5,1% da população é analfabeta, 7,1% possui o ensino fundamental completo e assim por diante. Ao observarmos isoladamente sexo masculino ou sexo feminino, vemos que essas mesmas distribuições praticamente se mantém. Assim, nossa conclusão a partir desses dados, é que o sexo não tem relação com o grau de instrução.
Vamos supor que a gente queira ver a relação entre o sexo e a escolha entre faculdade de exatas ou humanas a partir dos dados (hipotéticos) dos alunos de um determinado colégio:
Calculando as distribuições por sexo:
Veja agora que a distribuição de alunos por curso, ao desconsiderarmos o sexo dos alunos, é de 49,8% para exatas e 50,2% para humanas. Entretanto, quando consideramos o sexo dos alunos, essa distribuição muda, indicando que há uma associação (~ dependência) entre sexo e escolha do curso.
Nota: As tabelas utilizadas como exemplo também são chamadas de Tabelas de Contingência.
0 comentários em “Análise Bidimensional para Variáveis Qualitativas”