Tipos de vieses

Viés é um tipo de tendência, um peso desproporcional, que damos a alguma coisa. Quando alguém está enviesado, é porque sua visão está distorcida para algum dos lados do tema. Na estatística, obviamente, viés é um tema muito importante. Análises com algum tipo de viés, por mais que contenham dados, possuem conclusões equivocadas. No post de hoje, vou falar de 4 tipos de viés que você deve prestar atenção quando estiver fazendo alguma pesquisa ou avaliando algum artigo/estudo. Bora lá!

VIÉS DE CONFIRMAÇÃO

Primeiro, vamos com o mais popular de todos, o viés de confirmação. A ideia por trás dele é bem simples: as pessoas prestam atenção somente em informações que confirmem suas crenças. Pode ser observado também quando as pessoas buscam informações que validem suas crenças, algo que valide a hipótese inicial que tinham. Ou seja, as análises servem apenas para confirmar algo já estabelecido na cabeça enviesada.

Frequentemente, vemos estatísticos falando sobre a inutilidade dos horóscopos. Isso porque o que acontece na leitura do horóscopo é justamente o viés de confirmação. Sabe quando aquele seu amigo vai ler as características de um signo e diz: “nossa, isso é muito eu”! Ele está sendo vítima do viés de confirmação. O que seu amigo fez, provavelmente, foi buscar descrições que batessem com o seu jeito, para assim confirmar que o horóscopo funciona.

Entretanto, saiba que este viés não está presente apenas entre os leigos. É muito comum pessoas experientes em algum negócio também serem vítimas dele. Imagine que um analista levantou alguns números para confirmar que as vendas haviam sido causadas pelas propagandas. Para fazer isso, ele levanta o número de vendas nos dias seguintes à exibição da propaganda. Como o número não faz sentido, ele começa a buscar em períodos específicos. Depois em públicos específicos. Ou seja, ele já tem a conclusão que quer chegar e fica caçando algo que justifique. Ele também está sendo vítima do viés!

Fonte: https://www.pinterest.com/pin/168251736065165909/
VIÉS DE VARIÁVEL OMITIDA

Dando sequência, vamos falar do meu preferido, muito presente em análise econômica e política: o viés de variável omitida. Neste caso, como o próprio nome já diz, a questão toda é que algumas análises podem deixar variáveis relevantes de fora e, por causa disso, detectar o problema errado.

Imagine que você deseja entender se estudar em uma faculdade de ponta faz com que uma pessoa tenha um salário alto. Por conta disso, você começa uma análise comparando o salário médio das pessoas que se formaram no ITA com o salário médio das pessoas que se formaram na Uniqualquer (universidade fictícia de nível intermediário). O que seu estudo mostra é que quem se formou no ITA tem salário superior ao de quem se formou na Uniqualquer. Logo, você assume que se formar no ITA causa o resultado de ter um salário maior.

No entanto, repare que quem se formou no ITA foram as pessoas que passaram por uma prova muito difícil. Logo, também são pessoas mais estudiosas, ou talvez com um QI mais alto. Será que não seria o caso de que o ITA possui os alunos mais estudiosos e por isso quem se formou lá tem salário mais alto? Neste caso, não seria a variável “a pessoa ser estudiosa” ou “a pessoa ter QI alto” que levaria a um salário mais alto e não o ITA?

Pois bem, você acabou de descobrir o que é o viés de variável omitida. A variável QI e a variável “ser estudioso” são variáveis relevantes e que foram omitidas da análise. Elas tem um efeito na variável explicativa que estávamos analisando – entrar no ITA – e também na variável resposta – ter salário alto. Por conta disso, a gente tratou a entrada no ITA como sendo o que explica o salário, sendo que na verdade ser estudioso seria o mais correto.

A imagem abaixo ilustra bem como funciona o viés de variável omitida. No nosso exemplo, a bolinha laranja seria “ser estudioso” ou “ter QI alto”, e as bolinhas azuis na parte superior seriam estudar no ITA e ter um alto salário:

Fonte da Imagem: https://campus.datacamp.com/courses/machine-learning-for-marketing-analytics-in-r/modeling-customer-lifetime-value-with-linear-regression?ex=7

VIÉS DE SELEÇÃO

Dando sequência, aqui você pode notar que o nome diz tudo, e o problema se encontra na hora de selecionar participantes para sua pesquisa/análise. O ponto é identificar como a seleção deve ser feita e os problemas que levam a tal viés.

Imagine que vc é um eleitor do político XYZ. Só que este político é muito mais querido por eleitores de classe média alta – um grupo grande em números absolutos, mas pouco representativo no Brasil. Como você é cético, não acredita muito nas pesquisas eleitorais. Para descobrir quem será eleito, você monta sua própria pesquisa no Facebook, perguntando em qual candidato as pessoas pensam em votar.

Parece que você resolveu seu problema, afinal, com todos os compartilhamentos que rolaram, você obteve milhões de votos. Entretanto, lembre-se de que a sua rede é composta principalmente por eleitores de classe média, pessoas de seu círculo social. Ou seja, você conseguiu ali algumas milhões de opiniões, mas essas opiniões fazem parte de um grupinho específico de brasileiros; e esse grupinho não representa o que o brasileiro médio pensa. Você caiu no viés de seleção.

Quem vivenciou as eleições passadas viu isso acontecer em peso. Diversas pessoas tinham várias inferências com base nos usuários do Twitter. Só que o Twitter é frequentado por uma bolha bem específica, que não representa o Brasil todo.

Fonte da Imagem: https://towardsdatascience.com/what-is-statistical-bias-and-why-is-it-so-important-in-data-science-80e02bf7a88d

O viés de seleção pode ocorrer por diversos outros motivos. Se a pesquisa for feita por telefone fixo, por exemplo, ela vai ficar só naquele perfil que possui telefone fixo – jovens, por exemplo, provavelmente ficariam de fora. Se for uma pesquisa com voluntários, você precisaria entender se quem se voluntaria tem alguma propensão a algum dos lados da pesquisa.

O ponto em questão é que sua análise deve sempre ter uma amostra REPRESENTATIVA da população para ter algum valor estatístico. Abaixo, temos a ilustração de duas amostras não-representativas e uma representativa.

Fonte da Imagem: https://gmatclub.com/forum/article-representative-sample-a-concept-tested-in-gmat-cr-158832.html

Se quiser saber um pouco mais sobre amostras, veja este post: Amostra: Definição e Exemplo Prático

VIÉS DE SOBREVIVÊNCIA

Por fim, vamos passar rapidinho pelo viés de sobrevivência. Novamente, preste atenção ao nome, SOBREVIVÊNCIA, que você já terá uma ideia do problema. Ou seja, a preocupação aqui é tirar conclusões equivocadas somente com base em quem sobreviveu ao experimento.

Isso pode acontecer quando você testa uma droga e tira conclusões com base nos sobreviventes, em quem restou ao fim do experimento. É preciso ter cuidado ao lidar com esses dados. Quem morreu, morreu por qual motivo? Os restantes são ainda representativos? Todas essas perguntas precisam estar no seu radar.

É importante saber também que nem só a área médica lida com o viés de sobrevivência. Suponha que você trabalhe no exército e quer reforçar os caças. Para isso, você verifica os caças que voltaram de batalha. Ao olhar as regiões mais atingidas, você pode pensar que ali é onde deveria ter algum tipo de reforço. Novamente, veja que você só está olhando os caças que voltaram. Talvez seja justamente as partes não acertadas que você deveria colocar um reforço, afinal, podem ter sido elas que causaram a derrubada dos que não voltaram*.

E é isso gente! Creio que agora vocês não vão mais cair nessas armadilhas!

E aí? Gostou do conteúdo? Se inscreva para receber todas as novidades. Deixe seu e-mail em INSCREVA-SE na barra à direita, logo abaixo de pesquisar. E, por favor, não deixe de comentar, dar seu feedback e, principalmente, compartilhar com seus amigos. De verdade, isso faz toda a diferença. Além disso, você também pode acompanhar mais do meu trabalho seguindo a conta de Twitter @EstatSite ou por alguma das redes que você encontra em Sobre o Estatsite / Contato, como meu canal de Youtube Canal do Yukio. E se você gosta de tecnologia, escute o Pitacotech!

Bons estudos!

 

* Sobre o exemplo dos caças: Amostra que perde guerra!

** Leituras interessantes correlacionadas: The Ultimate Mission of a Data Scientist: Support Decision Making

5 comentários em “Tipos de vieses”

      1. É possível, porque dá para você chamar muita coisa de viés, mas acho que aí é exagero, muita coisa vai se sobrepor, sabe… vão ser nomes diferentes para coisas muito parecidas rs

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *