Como marcar o percentil no SAS?

Matemáticos, estatísticos e cientistas de dados em geral, gostam de trabalhar com percentil. Faz mais sentido do que dividir uma variável contínua em faixas de valor quaisquer, escolhidas de forma subjetiva. No SAS, eu costumo criar essas faixas com o PROC UNIVARIATE. Eu crio uma tabela auxiliar com os valores de cada percentil e depois marco na minha base à qual percentil que o indivíduo (ou elemento qualquer ali) pertence. Não sei se é a melhor forma, mas funciona. Espero que o código abaixo lhe seja útil: Continuar a ler “Como marcar o percentil no SAS?”

Regressão Linear: Interpretação e Análise dos Resíduos com SAS

Regressão linear foi um assunto bastante comentado quando eu criei este blog. Agora, vamos ver como é fácil rodá-la no SAS e, no mesmo código, fazer uma análise visual dos resíduos. Continuar a ler “Regressão Linear: Interpretação e Análise dos Resíduos com SAS”

Correlação Parcial e Semiparcial: Definição e Código SAS

Além da correlação linear comumente utilizada na estatística, duas outras correlações podem ser interessantes para sua análise: parcial e semiparcial. Ambas dizem respeito à associação entre as variáveis, no entanto, agora trabalhamos com a ideia de manter outras variáveis controle constantes. Continuar a ler “Correlação Parcial e Semiparcial: Definição e Código SAS”

Verificar se alguma das colunas é missing no SAS

Já vimos algumas formas de lidar com variáveis missing, tanto no post Tutorial: Proc Sql (SAS), quando no Formas de deletar linhas com Missing no SAS. Mas essas são formas de olhar para uma variável e excluir a linha. E se quisermos olhar para todas as variáveis? Continuar a ler “Verificar se alguma das colunas é missing no SAS”

Média Geométrica no SAS

A média é uma medida de tendência central muito utilizada, mas com vários problemas. Se temos outliers, geralmente preferimos utilizar a mediana. Outras vezes vamos preferir médias ponderadas. Em outros casos, quando temos medidas que crescem de forma exponencial, ou casos de distribuições assimétricas, vamos falar da média geométrica.
Continuar a ler “Média Geométrica no SAS”

SAS: Representatividade de cada linha e Soma Cumulativa

Recentemente me pediram ajuda com o SAS, para que fosse possível colocar, para determinada coluna, o quanto cada linha representava (%) da soma total dessa coluna. Na sequência, seria preciso colocar a soma cumulada desses percentuais. Continuar a ler “SAS: Representatividade de cada linha e Soma Cumulativa”

Formatação de Datas no SAS

Sim, continuamos aprendendo a lidar com formatações no SAS. Como sabemos, os dados nem sempre chegam no formato certo. Pode ter número em formato de texto, data em formato de número, além de outras complicações. Hoje, vamos complementar o post Formatando Datas no SAS com mais algumas dicas de como formatar os campos de data no SAS. Continuar a ler “Formatação de Datas no SAS”