Há várias formas de se obter estatísticas descritivas no Python. A mais comum é utilizando o describe(). Porém, essa função não é tão útil quando precisamos de resumos por grupo. Imagine, por exemplo, tentar obter a idade média dos clientes por estado, ou por gênero. Além dessa flexibilização, seria interessante também poder fazer um resumo de alguma métrica criada por você. O post de hoje é, claro, sobre isso. Vamos obter um resumo estatístico agrupando por categoria, além de incluir funções criadas por nós mesmos, em Python. Continuar a ler “Resumo Estatístico Agrupando por Categoria em Python”
Etiqueta: variância
ANOVA em Python
Diferente do que normalmente faço, este post não será bem um post, apenas um encaminhamento para meu GitHub (e também para deixar duas imagens que você não conseguirá ver por lá). No link abaixo, vocês vão direto para o código para rodar a ANOVA em Python. A última parte do código está em inglês, pois eu simplesmente copiei algumas explicações. Prometo que ajustarei isso em breve, mas queria postar para não deixar vocês sem esse conteúdo tão essencial em análise de dados. Continuar a ler “ANOVA em Python”
Variáveis Aleatórias Contínuas
Dando continuidade aos posts sobre variáveis aleatórias (se você ainda não leu os demais, vá em Variáveis: Definição e Classificação e Variáveis Aleatórias Discretas), vamos falar agora das variáveis aleatórias contínuas. Vamos entender a definição destas variáveis, entender suas funções e como calcular o valor médio e a variância. Continuar a ler “Variáveis Aleatórias Contínuas”