Exercício: Analisar Gráficos que Induzem ao Erro na Interpretação

Resolvi compartilhar um exercício que tive que fazer, no qual o objetivo era analisar um gráfico e localizar suas falhas. Isto tudo com base num trabalho de Alberto Cairo, chamado Graphics Lies, Misleading Visuals (recomendadíssimo!). Recebi 15/15 pontos de três avaliadores, mas fica aí aberto para quem tiver críticas ou sugestões. Recomendo também que façam este tipo de exercício, ainda que não tenham um avaliador. Só o fato de parar para pensar no tema já traz uma boa evolução.

Primeira Parte: Localize um exemplo de um gráfico enganoso que usa um ou mais dos mecanismos descritos no texto de Cairo: (1) Esconder dados relevantes; (2) exibir dados demais e obscurecer a realidade; (3) Distorcer os dados através de formas visuais.

Descreva brevemente o contexto para o visual, abordando as seguintes questões:

  1. Qual é a fonte do visual? (por exemplo, URL ou citação bibliográfica)
  2. Quem é o público-alvo (ou seja, decodificadores)? Como você sabe disso?

Resposta:

O gráfico foi apresentado em um artigo publicado no The Interim (você pode conferir o artigo no seguinte link: http://www.theinterim.com/features/causes-of-deaths-in-canada/). Eu não sei qual é o viés do The Interim, mas acreditaria pelo artigo que é um jornal conservador. O artigo é claro ao dizer que o aborto é um grande problema no Canadá. O argumento proposto pelo artigo, que é direcionado para o público em geral (provavelmente composto por adultos +30 anos), incluindo pessoas com pouco conhecimento em estatística, argumenta que o aborto é um grande problema no país e a causa de muitas mortes. Mais especificamente, é a principal causa de mortes no país.

Segunda Parte:

  1. Identifique o (s) componente (s) específico (s) do visual que é enganoso (s)
  2. Para cada parte da visualização que é enganosa, identifique o mecanismo usado: ocultando dados relevantes para destacar o que nos beneficia; exibindo muitos dados para obscurecer a realidade; usando formas gráficas de maneira inadequada (distorcendo os dados)
  3. Explique como os mecanismos são usados para enganar

Minha Resposta:

  1. Os principais problemas são: a forma como cada barra foi construída, elas deveriam conter informações que fossem relacionadas (por exemplo, uma barra poderia ter somente as mortes devido a problemas de saúde pública); a escolha das cores e detalhes utilizados; o curto período de tempo (apenas um ano).
  2. Usar muitos dados, o que pode obscurecer a realidade: quando os autores usam muitas informações para cada barra, o que torna cada uma não tão homogênea como deveria ser. Esconder dados relevantes para destacar o que beneficia o ponto de vista do autor: quando os autores usam um curto período de tempo. Ambos os pontos são mais detalhados no item 3.
  3. Os gráficos parecem ter muitos problemas, considerando os argumentos do Cairo sobre o que pode causar confusão na interpretação de um gráfico. O principal problema é que o gráfico mostra muitos dados, o que pode obscurecer a realidade. Para começar, o autor usa muitas informações para cada barra, o que as torna pouco homogêneas. Por exemplo, a mesma barra que representa acidentes, como um acidente de carro, é usada para representar overdoses. Essas coisas não parecem estar relacionadas quando pensamos em ciências sociais e políticas públicas. Ao mesmo tempo, doenças respiratórias e doenças cardiovasculares são problemas de saúde e poderiam estar numa mesma barra. Todas essas escolhas de como agregar os dados para compor cada barra provavelmente foram escolhidas sabiamente pelo autor para destacar o aborto. Além disso, o gráfico em si mostra muita informação, como muitas cores e legendas, o que também pode causar confusão. Agora, um segundo problema que alguém poderia argumentar é a informação omitida (isto é, esconder dados relevantes para destacar o que beneficia o ponto de vista do autor). O autor usou apenas um ano de dados, o que é muito pouco para a maioria dos estudos e é definitivamente muito pouco para este. Não está claro se houve alguma lei de tráfego ou uma política pública diferente que poderia ter afetado algumas barras. Dito isto, há melhorias consideráveis no gráfico que poderiam ter mudado a conclusão do leitor.

Obviamente, esta questão não tem uma resposta pronta como muitas das que coloco aqui. Mas é sempre importante para um cientista de dados sair um pouco do código para pensar no que se está produzindo e como é feita a apresentação das informações levantadas. Espero que este breve exercício seja proveitoso para vocês.

E se você gostou do post, não vá embora sem deixar uma curtida ou um comentário. Eu sei que não parece relevante, mas faz diferença para mim e custa pouco para você. Se encontrou algum erro ou tem alguma sugestão, dúvida, elogio ou crítica, pode escrever nos comentários ou me enviar uma mensagem diretamente em Sobre o Estatsite. E visite também a conta do Twitter @EstatSite.

Forte abraço e bons estudos!

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *