Tutorial: Lidando com Missing no SAS

Já falei sobre missing em alguns posts aqui (ver post Verificar se alguma das colunas é missing no SAS e Formas de deletar linhas com Missing no SAS), mesmo assim, notei que faltaram algumas coisas. Este post é para dar conta do que não foi abordado no assunto. Ou seja, pode considerar o TUTORIAL como sendo a soma destes 3 posts. Continuar a ler “Tutorial: Lidando com Missing no SAS”

Tutorial: PROC MEANS no SAS

Como falei no post anterior sobre frequências (ver TUTORIAL: PROC FREQ NO SAS), é difícil entender bases grandes somente olhando para o analítico. Normalmente, vamos tentar obter algumas medidas que resumam o conteúdo em questão. Uma das formas de obter estas medidas, quando falamos de variáveis numéricas, é utilizando o proc means. Com o proc means você consegue encontrar a média, mediana, percentil, quartil  e várias outras estatísticas no SAS. Veja abaixo como utilizar este procedimento para entender seus dados. Continuar a ler “Tutorial: PROC MEANS no SAS”

TUTORIAL: PROC FREQ NO SAS

Sempre que você for trabalhar com bases grandes, você provavelmente não vai conseguir dizer o que está dentro daquela base e/ou entender se seus dados fazem sentido, somente olhando para o analítico da base. Uma das formas de se analisar o conteúdo de uma base, é verificando as frequências com que aparecem algumas informações. Verificar a frequência é importante não só para validação das informações, como também para se obter insumos para tomada de decisão. No SAS, a principal forma de se obter as frequências é através do proc freq. Vamos verificar quais as diferentes formas de se usar este comando. Continuar a ler “TUTORIAL: PROC FREQ NO SAS”

Como pular a primeira linha no SAS

Criar, ou “setar”, uma base no SAS, tirando uma variável específica, é até que bem manjado. Basta utilizar o famoso DROP. No código abaixo, criamos a base_new, pegando a base_old e tirando as variáveis var_1 e var_2: Continuar a ler “Como pular a primeira linha no SAS”

Usando dia, mês e ano para formar uma data no SAS

Alguns dos posts mais visitados aqui são os de formatação de datas no SAS. Você pode ver Formatação de Datas no SAS e esse Convertendo diferentes formatos de data no SAS, como exemplos. Agora, vou mostrar uma outra função que eu desconhecia, a MDY( ). Ela é útil, pois além de intuitiva, serve para quando você tem que lidar com os campos dia, mês e ano, separados. No exemplo abaixo, temos uma coluna com o dia, outra com o mês e uma última com o ano. Vamos criar um campo no formato de data, na ordem mês, dia e ano: Continuar a ler “Usando dia, mês e ano para formar uma data no SAS”

Importando Arquivos no SAS

Nem sempre os arquivos que você receberá, estarão no formato desejado. É comum recebermos arquivos em .txt, ou até mesmo em Excel, e precisarmos utilizá-los junto com bases em SAS. Felizmente, o SAS tem o PROC IMPORT para facilitar muito nossa vida. A sintaxe é bem simples, não tem muito segredo: Continuar a ler “Importando Arquivos no SAS”

Filtro e Criação de Variáveis com IF no SAS

O if é provavelmente o comando mais utilizado no SAS, junto com o JOIN (ou MERGE para os fãs de data step). Isso tudo porque é ele que vai te ajudar a fazer filtros, criar alguma variável de acordo com uma condição, criar mútiplas variáveis de acordo com uma condição ou até criar múltiplas variáveis de acordo com múltiplas condições. Continuar a ler “Filtro e Criação de Variáveis com IF no SAS”

Como marcar o percentil no SAS?

Matemáticos, estatísticos e cientistas de dados em geral, gostam de trabalhar com percentil. Faz mais sentido do que dividir uma variável contínua em faixas de valor quaisquer, escolhidas de forma subjetiva. No SAS, eu costumo criar essas faixas com o PROC UNIVARIATE. Eu crio uma tabela auxiliar com os valores de cada percentil e depois marco na minha base à qual percentil que o indivíduo (ou elemento qualquer ali) pertence. Não sei se é a melhor forma, mas funciona. Espero que o código abaixo lhe seja útil: Continuar a ler “Como marcar o percentil no SAS?”

Média Geométrica no SAS

A média é uma medida de tendência central muito utilizada, mas com vários problemas. Se temos outliers, geralmente preferimos utilizar a mediana. Outras vezes vamos preferir médias ponderadas. Em outros casos, quando temos medidas que crescem de forma exponencial, ou casos de distribuições assimétricas, vamos falar da média geométrica.
Continuar a ler “Média Geométrica no SAS”

SAS: Representatividade de cada linha e Soma Cumulativa

Recentemente me pediram ajuda com o SAS, para que fosse possível colocar, para determinada coluna, o quanto cada linha representava (%) da soma total dessa coluna. Na sequência, seria preciso colocar a soma cumulada desses percentuais. Continuar a ler “SAS: Representatividade de cada linha e Soma Cumulativa”