Tipos de vieses

Viés é um tipo de tendência, um peso desproporcional, que damos a alguma coisa. Quando alguém está enviesado, é porque sua visão está distorcida para algum dos lados do tema. Na estatística, obviamente, viés é um tema muito importante. Análises com algum tipo de viés, por mais que contenham dados, possuem conclusões equivocadas. No post de hoje, vou falar de 4 tipos de viés que você deve prestar atenção quando estiver fazendo alguma pesquisa ou avaliando algum artigo/estudo. Bora lá! Continuar a ler “Tipos de vieses”

Livros da Springer disponíveis para download gratuitos

A Springer liberou diversos livros para download em PDF. É uma editora excelente, uma das minhas preferidas junto com a O’Reilly. Vale a pena conferir alguns para Ciência de Dados: Continuar a ler “Livros da Springer disponíveis para download gratuitos”

Como Big Data Explica Freud?

Freud é um nome muito conhecido. Mais comum para filósofos e psicólogos, ele aparece constantemente em papos não-acadêmicos. Mesmo conhecido por todos, explicar suas ideias é algo mais complicado. Suas teorias sempre foram muito intrigantes, capazes de gerar muitas dúvidas e ceticismo. Costumeiramente, mexe com algo mais profundo e, por vezes, intangível. Tanto é que subconsciência é uma palavra que aparece quase sempre que se fala de suas principais teorias. Bem, mas se suas ideias são baseadas em coisas que não estão na nossa consciência, cabe a nós aceitá-las e ponto final. Não tem como provar que elas são falsas ou verdadeiras, certo? Ou será que tem? Continuar a ler “Como Big Data Explica Freud?”

Resumão dos Tweets

Muito do que posto no Twitter acaba não vindo parar aqui. Às vezes são coisas tão breves que nem conseguiria elaborar um post. Outras vezes, são threads que até caberiam aqui, mas que são mais fáceis de se postar por lá. E tem coisa também que são só reflexões aleatórias ou piadinhas. De qualquer forma, aqui vão alguns dos tweets recentes, para quem não acompanha a conta saber mais ou menos qual é a pegada por lá. No fim deste post, há uma thread que essa sim acho essencial para todos que estudam ciência de dados. Continuar a ler “Resumão dos Tweets”

Qual amostra mais confiável, uma de 90% da população ou uma de 5%?

Lembra daquelas pesquisas eleitorais de Twitter ou qualquer outra plataforma falando: entre aqui e marque em quem você vai votar, vamos fazer uma amostra de X milhões de pessoas, mais confiável que as pesquisas atuais? Eu lembro bem, pois é sofrível para alguém que adora estatística ouvir isso. Se você está minimamente próximo da estatística na sua vida profissional ou acadêmica e ainda acredita que é uma amostra de 1 milhão de pessoas é mais confiável do que uma de 5 mil, se você é desses que não desconfia de pesquisas feitas na internet onde participa quem se dispõe a clicar e preencher as respostas, então aconselho a leitura de uma discussão de hoje que aconteceu no Twitter. Continuar a ler “Qual amostra mais confiável, uma de 90% da população ou uma de 5%?”

Exercício: Analisar Gráficos que Induzem ao Erro na Interpretação

Resolvi compartilhar um exercício que tive que fazer, no qual o objetivo era analisar um gráfico e localizar suas falhas. Isto tudo com base num trabalho de Alberto Cairo, chamado Graphics Lies, Misleading Visuals (recomendadíssimo!). Recebi 15/15 pontos de três avaliadores, mas fica aí aberto para quem tiver críticas ou sugestões. Recomendo também que façam este tipo de exercício, ainda que não tenham um avaliador. Só o fato de parar para pensar no tema já traz uma boa evolução. Continuar a ler “Exercício: Analisar Gráficos que Induzem ao Erro na Interpretação”

Probabilidade (II): Princípio Fundamental da Contagem

Em análise combinatória, princípio fundamental da contagem é a ideia de que a quantidade de formas que ações independentes distintas podem ocorrer é a multiplicação do número de modos em que elas podem se apresentar. Em outras palavras, se você tem um evento X que pode ocorrer de n formas, um evento Y, distinto e independente, que pode ocorrer de formas, o número de formas com que esses dois eventos podem se apresentar será n*m. Continuar a ler “Probabilidade (II): Princípio Fundamental da Contagem”

Probabilidade (I): Introdução e Conceitos Básicos

A probabilidade é o estudo da chance de ocorrência de um determinado evento. Quando jogamos um dado e perguntamos “qual a probabilidade de sair o número 3?”, queremos saber qual a chance de sair 3. Queremos saber o que é esperado deste evento, que é jogar um dado. A forma que temos de quantificar uma probabilidade é um número que vai de 0 até 1. Claro que, muito provavelmente, você prefira expressar a probabilidade em percentual, o que é a mesma coisa. Quando temos 100% de chance de que o evento ocorra, a probabilidade será 1, já quando temos 50%, a chance é 0,5. Continuar a ler “Probabilidade (I): Introdução e Conceitos Básicos”

Estatística Essencial em Forma de Anedota

Escrevi uma série de textos no Portal Deviante sobre experimentos, amostragem e outras formas de se fazer análises, além de explicar alguns conceitos estatísticos, todos em forma de historinhas, com exemplos bem claros. Cuidados que se deve ter e erros comuns. Todos bem leves e escritos de uma forma bem informal. Continuar a ler “Estatística Essencial em Forma de Anedota”

Testes de Hipóteses

INTRODUÇÃO: A QUESTÃO A SER RESPONDIDA

No mundo real é quase sempre impossível analisar uma população inteira para fazer um estudo. Um laboratório não conseguirá testar seu remédio em todos os indivíduos da população. O que é de praxe, é obter uma amostra, fazer os devidos testes com ela e tentar concluir se o remédio funciona ou não. Em suma, o que estamos fazendo é testando uma hipótese, a de que o remédio funciona. Mas e se você tivesse 50 pacientes e observasse que o remédio funciona para 30 deles? Isso é suficiente para concluir que o remédio funciona? Ou deveríamos concluir que ele não funciona? Continuar a ler “Testes de Hipóteses”