Escolhendo o diretório no R

Esse post bem que poderia ser uma continuação do Primeiros passos no R Studio, pois trataremos de algumas coisas que você vai fazer assim que abrir o R e iniciar seus trabalhos, como escolher o diretório em que você vai salvar as figuras ou carregar os dados, saber as dimensões do arquivo externo que você carregou, etc., é bem útil.  É também um pouco repetitivo, já vimos algumas dessas funções separadamente, mas é bom reforçar para quem não viu outros links.

Leia mais…

Substituindo missing pela média no R

Já mencionei aqui como excluir os valores missing dos seus cálculos no R, e aqui explico como excluir as linhas contendo valores missing. Porém, como vocês bem sabem, ao excluirmos a linha inteira temos perda de informação, afinal, uma coluna pode estar missing mas todo o restante da linha conter informação. Sendo assim, alguns estatísticos podem preferir não excluir a linha e fazer a escolha de substituir esses missing por outro valor, aqui vamos substituir pela média:

Leia mais…

SAS Group By no R

Já aprendemos como somar e agrupar os dados no SAS aqui, no R isso é tão simples quanto, basta você utilizar a função tapply(). A função é composta basicamente de três elementos: o vetor contendo valores, o campo que será utilizado no agrupamento e a função que será aplicada. Continuar a ler “SAS Group By no R”

A probabilidade do outro filho ser menino ou menina é…

Assim como no post Qual a probabilidade de tirar o número 1 jogando um dado duas vezes? vamos olhar para mais uma pegadinha clássica nas questões de probabilidade. E, assim como no outro post, um dos erros cometidos é não pensar no conjuntos de resultados possíveis.

Se um casal tem duas crianças, e lhe foi dito que uma delas é um menino. Qual a probabilidade da outra criança ser também um menino?

Leia mais…

É hora de tirar a média das suas análises?

A média é a medida mais utilizada da estatística descritiva. O que muita gente não sabe, é que essa medida é amplamente questionada, principalmente pelos próprios estatísticos, que hoje em dia dificilmente a utilizam como um valor relevante para descrever dados e extrair insights.

Leia mais…

Correlação igual a zero implica independência?

Já analisamos diversas vezes a correlação de Pearson, como nos posts Correlação vs. Casualidade, Correlação vs. Causalidade – Parte 2 e Correlação: Não implica causalidade, mas tem seu valor. Na maioria das vezes analisamos como podemos nos enganar ao observarmos uma alta correlação. Não vimos porém, como algumas vezes nos enganamos ao analisarmos baixas correlações. Mais especificamente, tente responder a uma pergunta antes de prosseguir com o post: é possível as variáveis terem alguma relação se a correlação entre elas é igual a zero?

Leia mais…