Recentemente, recebi um e-mail pedindo uma ajuda para montar um histograma no R. O problema que a pessoa enfrentava era o seguinte: ao usar a função hist(), o R estava agrupando as quantidades que estavam na barra 1 e 0. Ou seja, se a pessoa tivesse 5 ocorrências do valor 0 e outras 3 com valor 1, o gráfico apresentaria só uma barra, registrando 8 ocorrências. Veja o exemplo abaixo:
x = c(0,0,0,0,0,1,1,1,2,2,7,7) hist(x)
Note que temos a representação das duas ocorrências do número 2 e também do número 7. No entanto, para os números 0 e 1, os valores ficaram agrupados. O que acontece aqui é que o histograma do R tem por sua definição padrão o “right-closed interval”. Isto é, o R está enxergando um intervalo fechado para a primeira barra, um intervalo de 0 a 1 e que contém 1. Para lidar com este problema, você precisa justamente usar o argumento que especifica ao R se o intervalo à direita é fechado ou não. Veja a diferença quando usamos o argumento right na função hist():
x = c(0,0,0,0,0,1,1,1,2,2,7,7) hist(x, right = TRUE)
x = c(0,0,0,0,0,1,1,1,2,2,7,7) hist(x, right = FALSE)
Note que no segundo exemplo temos uma barra separada para a frequência de 1. Ou seja, não teremos o “problema” de agrupar a frequência de 0 junto com a de 1.
Por hoje é só, apenas uma pequena dica para somar ao post Histograma no R.
Bons estudos!