Python, R ou SAS? Meus 2 centavos sobre esse debate!

Eu não costumo dar muitos pitacos sobre a discussão R ou Python. Na verdade, tem vezes que falo, mas é sempre falando que não importa. Recentemente, solicitaram minha resposta no Quora e resolvi atender ao pedido. Segue minha resposta. Continuar a ler “Python, R ou SAS? Meus 2 centavos sobre esse debate!”

Tutorial: Lidando com Missing no SAS

Já falei sobre missing em alguns posts aqui (ver post Verificar se alguma das colunas é missing no SAS e Formas de deletar linhas com Missing no SAS), mesmo assim, notei que faltaram algumas coisas. Este post é para dar conta do que não foi abordado no assunto. Ou seja, pode considerar o TUTORIAL como sendo a soma destes 3 posts. Continuar a ler “Tutorial: Lidando com Missing no SAS”

Localizando Outliers Através do Intervalo Interquartil (+ Boxplot + Código SAS)

Recentemente, estava trabalhando com uma base de mais ou menos 500 mil linhas, onde a maior parte dos dados de uma determinada variável estava no intervalo de 0 a 1.000. Esta mesma variável, no entanto, possuía algumas linhas em que o valor dela era 5.000, 10.000 e até 15.000. Ou seja, haviam alguns outliers. Isto era um problema, principalmente, quando eu construía um gráfico de distribuição. Para lidar com isso, eu exclui os outliers com base no conceito do intervalo interquartil. Continuar a ler “Localizando Outliers Através do Intervalo Interquartil (+ Boxplot + Código SAS)”

Diferença entre duas datas no SAS (em dias, meses ou anos)

Calcular a diferença entre duas datas no SAS é simples, basta subtrair uma data pela outra. Porém, se você quiser fazer a diferença em meses, anos, semanas ou alguma unidade do tipo, há duas escolhas: (1) realizar a subtração e depois dividir o valor pelo número de dias correspondentes ao período (ex.: dividir por 30 no caso de mês) ou (2) utilizar a função intck(). É desta segunda que vou falar neste post. Continuar a ler “Diferença entre duas datas no SAS (em dias, meses ou anos)”

Tutorial: PROC MEANS no SAS

Como falei no post anterior sobre frequências (ver TUTORIAL: PROC FREQ NO SAS), é difícil entender bases grandes somente olhando para o analítico. Normalmente, vamos tentar obter algumas medidas que resumam o conteúdo em questão. Uma das formas de obter estas medidas, quando falamos de variáveis numéricas, é utilizando o proc means. Com o proc means você consegue encontrar a média, mediana, percentil, quartil  e várias outras estatísticas no SAS. Veja abaixo como utilizar este procedimento para entender seus dados. Continuar a ler “Tutorial: PROC MEANS no SAS”

TUTORIAL: PROC FREQ NO SAS

Sempre que você for trabalhar com bases grandes, você provavelmente não vai conseguir dizer o que está dentro daquela base e/ou entender se seus dados fazem sentido, somente olhando para o analítico da base. Uma das formas de se analisar o conteúdo de uma base, é verificando as frequências com que aparecem algumas informações. Verificar a frequência é importante não só para validação das informações, como também para se obter insumos para tomada de decisão. No SAS, a principal forma de se obter as frequências é através do proc freq. Vamos verificar quais as diferentes formas de se usar este comando. Continuar a ler “TUTORIAL: PROC FREQ NO SAS”

Como pular a primeira linha no SAS

Criar, ou “setar”, uma base no SAS, tirando uma variável específica, é até que bem manjado. Basta utilizar o famoso DROP. No código abaixo, criamos a base_new, pegando a base_old e tirando as variáveis var_1 e var_2: Continuar a ler “Como pular a primeira linha no SAS”

Usando dia, mês e ano para formar uma data no SAS

Alguns dos posts mais visitados aqui são os de formatação de datas no SAS. Você pode ver Formatação de Datas no SAS e esse Convertendo diferentes formatos de data no SAS, como exemplos. Agora, vou mostrar uma outra função que eu desconhecia, a MDY( ). Ela é útil, pois além de intuitiva, serve para quando você tem que lidar com os campos dia, mês e ano, separados. No exemplo abaixo, temos uma coluna com o dia, outra com o mês e uma última com o ano. Vamos criar um campo no formato de data, na ordem mês, dia e ano: Continuar a ler “Usando dia, mês e ano para formar uma data no SAS”

Importando Arquivos no SAS

Nem sempre os arquivos que você receberá, estarão no formato desejado. É comum recebermos arquivos em .txt, ou até mesmo em Excel, e precisarmos utilizá-los junto com bases em SAS. Felizmente, o SAS tem o PROC IMPORT para facilitar muito nossa vida. A sintaxe é bem simples, não tem muito segredo: Continuar a ler “Importando Arquivos no SAS”

Filtro e Criação de Variáveis com IF no SAS

O if é provavelmente o comando mais utilizado no SAS, junto com o JOIN (ou MERGE para os fãs de data step). Isso tudo porque é ele que vai te ajudar a fazer filtros, criar alguma variável de acordo com uma condição, criar mútiplas variáveis de acordo com uma condição ou até criar múltiplas variáveis de acordo com múltiplas condições. Continuar a ler “Filtro e Criação de Variáveis com IF no SAS”