A média é a medida mais utilizada da estatística descritiva. O que muita gente não sabe, é que essa medida é amplamente questionada, principalmente pelos próprios estatísticos, que hoje em dia dificilmente a utilizam como um valor relevante para descrever dados e extrair insights.
Vamos supor que você queira analisar as condições salariais de uma empresa. Você extrai as informações dos salários dos funcionários e obtém os seguintes valores: 2.400, 2.500, 2.150, 2.250, 3.100, 3.090, 9.900, 11.000, 15.000, 1.850, 1.800, 1.950, 2.000.
A média salarial da empresa é R$ 4.537,70. Entretanto, se você observar os salários dos 13 funcionários, somente 3 ganham acima desse valor, enquanto os outros 10 (77%) ganham abaixo desse valor. Ou seja, a média faz você ter a impressão de que os salários são muito melhores do que realmente são. Para se ter uma ideia de um exemplo real, segundo esse link do Wikipedia, a mediana da renda familiar dos Estados Unidos em 2014 era de $53,718, enquanto a média era de $72,641 (35% maior).
Mas se excluirmos a média, o que vamos utilizar?
Nessas horas que vale a pena entender outras medidas que já explicamos em Estatística Descritiva e Percentil – Conceito e Código SAS.
Ainda analisando nossos dados salariais, temos uma mediana de 2.400 reais. Um valor muito mais próximo da realidade. Além disso, temos também um terceiro quartil de 3.100 reais. Se possuíssemos mais dados, poderíamos obter o 90° percentil e ter uma ideia melhor de concentração dos valores e possíveis outliers.
Resumindo, a não ser que seus dados possuam uma distribuição normal, a média dificilmente lhe trará alguma informação relevante. Talvez seja a hora de você abandoná-la e utilizar outras medidas…