Uma curtinha só para começar bem a semana…
Utilizando a base de dados german_credit_2 abaixo temos um exemplo de como criar uma variável binária – i.e., uma variável que recebe dois valores, 0 e 1 – com valor 1 para os clientes que possuem um montante de crédito acima de $ 1.000, e valor 0 para os que possuem menos que $ 1.000. Em outras palavras, criamos uma dummy n R. Incluímos uma forma de ler os dados em csv e uma forma de ler em excel:
## Le a base de dados csv dados = read.csv("../database/german_credit_2.csv"); ## le a base de dados excel - Primeiro instala pacote xlsx install.packages("xlsx"); library("xlsx"); dados = read.xlsx("../database/german_credit_2.xlsx", sheetIndex=1); ## cria variavel para quem tem montante maior que mil dados$valor1000 = as.numeric(dados$CreditAmount >= 1000);
E aí, curtiu o post?
E aí? Gostou do conteúdo? Se inscreva para receber todas as novidades. Deixe seu e-mail em INSCREVA-SE na barra à direita, logo abaixo de pesquisar. E, por favor, não deixe de comentar, dar seu feedback e, principalmente, compartilhar com seus amigos. De verdade, isso faz toda a diferença. Além disso, você também pode acompanhar mais do meu trabalho seguindo a conta de Twitter @UniDosDados, no Instagram @universidadedosdados ou por alguma das redes que você encontra em Sobre o Estatsite / Contato, como meu canal de Youtube Canal Universidade dos Dados.
Aproveite e adquira sua camiseta de data science na LOJA DA UNIVERSIDADE DOS DADOS. Vai ficar estiloso e me ajudar neste projeto!
BONS ESTUDOS!
Bom dia,
É preciso revisar o código: o arquivo para download está em excel, a variável Credit.Amount não tem ponto, etc.
Enoch, muito obrigado pelo comentário. O que aconteceu foi o seguinte: 1) No último post expliquei que o arquivo estava em excel porque o wordpress não aceita csv. Vou revisar o texto e incluir uma menção a função read.excel. 2) O ponto no Credit Amount existia no último arquivo do site. Como eu baixei e fui reescrevendo o código e depois só copiei e colei, ele acabou ficando com esse ponto. De qualquer forma, não deveria ter no post, já que eu disponibilizei o arquivo sem esse ponto (eu acho). Vou consertar o post ainda hoje.