Variáveis: Definição e Classificação

Se você já estudou algo de estatística, com certeza já ouviu muito a palavra variável. Esse nome importante aparece desde a introdução da matéria até quando falamos de modelos robustos em ciência de dados e machine learning. Hoje, vamos abordar sua definição formal, classificar os diferentes tipos e ver alguns exemplos.

Continuar a ler “Variáveis: Definição e Classificação”

Como obter a moda no R

Moda é uma medida de tendência central. A definição é simples: é o valor que aparece com maior frequência nos seus dados. Exemplo: a moda do conjunto {1,1,2,2,3,3,3,4} é 3. Hoje, vamos ver como obter essa métrica no R!

Leia mais…

Teorema de Bayes na Prática

Já expliquei sobre o Teorema de Bayes algumas vezes (Teorema de Bayes na prática: interpretando falso positivo e Probabilidade Condicional e o Teorema de Bayes). Para complementar o conteúdo, escrevi um texto no Portal Deviante com um pouco mais de contexto sobre o assunto, num tom bem informal: Deu positivo, mas tô de boa porque aprendi Bayes

A probabilidade do outro filho ser menino ou menina é…

Assim como no post Qual a probabilidade de tirar o número 1 jogando um dado duas vezes? vamos olhar para mais uma pegadinha clássica nas questões de probabilidade. E, assim como no outro post, um dos erros cometidos é não pensar no conjuntos de resultados possíveis.

Se um casal tem duas crianças, e lhe foi dito que uma delas é um menino. Qual a probabilidade da outra criança ser também um menino?

Leia mais…

É hora de tirar a média das suas análises?

A média é a medida mais utilizada da estatística descritiva. O que muita gente não sabe, é que essa medida é amplamente questionada, principalmente pelos próprios estatísticos, que hoje em dia dificilmente a utilizam como um valor relevante para descrever dados e extrair insights.

Leia mais…

Correlação igual a zero implica independência?

Já analisamos diversas vezes a correlação de Pearson, como nos posts Correlação vs. Casualidade, Correlação vs. Causalidade – Parte 2 e Correlação: Não implica causalidade, mas tem seu valor. Na maioria das vezes analisamos como podemos nos enganar ao observarmos uma alta correlação. Não vimos porém, como algumas vezes nos enganamos ao analisarmos baixas correlações. Mais especificamente, tente responder a uma pergunta antes de prosseguir com o post: é possível as variáveis terem alguma relação se a correlação entre elas é igual a zero?

Leia mais…

Qual a probabilidade de tirar o número 1 jogando um dado duas vezes?

Uma das perguntas mais comuns para quem estuda probabilidade ou é fã de jogos de azar: qual a probabilidade de sair o número X, pelo menos uma vez, ao jogarmos um dado n vezes?

Leia mais…

Qui-quadrado de Pearson e Coeficiente de Contingência

Complementando o post Análise Bidimensional para Variáveis Qualitativas, vamos entender agora uma medida quantitativa para entender como duas variáveis qualitativas se relacionam entre si.

Leia mais…