Categoria: Estatística Básica
Como obter a moda no R
Moda é uma medida de tendência central. A definição é simples: é o valor que aparece com maior frequência nos seus dados. Exemplo: a moda do conjunto {1,1,2,2,3,3,3,4} é 3. Hoje, vamos ver como obter essa métrica no R!
Teorema de Bayes na Prática
Já expliquei sobre o Teorema de Bayes algumas vezes (Teorema de Bayes na prática: interpretando falso positivo e Probabilidade Condicional e o Teorema de Bayes). Para complementar o conteúdo, escrevi um texto no Portal Deviante com um pouco mais de contexto sobre o assunto, num tom bem informal: Deu positivo, mas tô de boa porque aprendi Bayes
Probabilidade de um evento que nunca ocorreu
A técnica desse post provavelmente será pouco utilizada por ser algo atípico. Mas achei interessante, pode ser útil no dia a dia de um cientista de dados. Encontrei no ótimo blog do John D. Cook. Vamos lá então…
Arranjo, Permutação e Combinação
Muita gente faz confusão na hora de calcular o número de possibilidades de organizar elementos em algum espaço. Três perguntas típicas de provas de estatística e que causam muita confusão são:
A probabilidade do outro filho ser menino ou menina é…
Assim como no post Qual a probabilidade de tirar o número 1 jogando um dado duas vezes? vamos olhar para mais uma pegadinha clássica nas questões de probabilidade. E, assim como no outro post, um dos erros cometidos é não pensar no conjuntos de resultados possíveis.
Se um casal tem duas crianças, e lhe foi dito que uma delas é um menino. Qual a probabilidade da outra criança ser também um menino?
É hora de tirar a média das suas análises?
A média é a medida mais utilizada da estatística descritiva. O que muita gente não sabe, é que essa medida é amplamente questionada, principalmente pelos próprios estatísticos, que hoje em dia dificilmente a utilizam como um valor relevante para descrever dados e extrair insights.
Correlação igual a zero implica independência?
Já analisamos diversas vezes a correlação de Pearson, como nos posts Correlação vs. Casualidade, Correlação vs. Causalidade – Parte 2 e Correlação: Não implica causalidade, mas tem seu valor. Na maioria das vezes analisamos como podemos nos enganar ao observarmos uma alta correlação. Não vimos porém, como algumas vezes nos enganamos ao analisarmos baixas correlações. Mais especificamente, tente responder a uma pergunta antes de prosseguir com o post: é possível as variáveis terem alguma relação se a correlação entre elas é igual a zero?
Qual a probabilidade de tirar o número 1 jogando um dado duas vezes?
Uma das perguntas mais comuns para quem estuda probabilidade ou é fã de jogos de azar: qual a probabilidade de sair o número X, pelo menos uma vez, ao jogarmos um dado n vezes?
Qui-quadrado de Pearson e Coeficiente de Contingência
Complementando o post Análise Bidimensional para Variáveis Qualitativas, vamos entender agora uma medida quantitativa para entender como duas variáveis qualitativas se relacionam entre si.