Como tratar duplicidades no SAS

É comum termos bases com duplicações, seja por erros ou por características próprias das bases. Se você quiser utilizar uma base sem duplicação no SAS, você deve combinar o comando de ordenação, o proc sort, com algum tipo de lógica. Vejamos um exemplo de uma tabela com duplicidade:

Leia mais…

Concatenar campos no SAS

Quando unimos duas ou mais colunas para criar uma nova, podemos criar um novo campo que sirva como chave única para identificar os indivíduos ou até facilitar buscas por palavras chaves. No post de hoje, vou mostrar como você pode unir colunas no SAS de algumas formas bem simples. Vamos lá!

Leia mais…

Deletando Linhas no SAS Condicionalmente

Como deletar uma linha no SAS dada uma condição?

Basta combinar o if com o delete. No exemplo abaixo, primeiro foi criado uma tabela chamada TESTE com as colunas NOME e UF de cada cliente. Em seguida, deletamos todas as linhas cuja coluna UF seja SP

Leia mais…

Alterando Comprimento de Campo Novo no SAS

Muitas vezes no SAS precisamos criar novos campos. No entanto, é preciso saber lidar com o comprimento dos campos. Por exemplo, suponha que você tenha uma tabela com informações de vendas das suas lojas:

Leia mais…

Tratando Duplicidades no SAS

É comum encontrar campos duplicados em uma tabela. Seja porque algum join ou agrupamento que poderia ter sido melhor realizado (mesmo não trazendo informações erradas), por causa de algum erro de inserção da informação ou qualquer outra coisa. No SAS, há algumas maneiras práticas de tratar esse erro. Aqui você vai aprender a ordenar sua tabela com PROC SORT, exluir duplicidades com NODUPKEY, gerar uma tabela com os valores que estavam duplicados utilizando DUPOUT e excluir duplicidades por todos os campos com BY _ALL_.

Leia mais…