Muitas vezes, se queremos praticar algo no R (ou outra linguagem), é interessante criarmos um conjunto de dados de mentira ou retirar uma amostra de um conjunto real. Se o dataset falso ou a amostra tiver menos observações, você não vai precisar demorar alguns longos minutos testando o que criou, você vai ver aquilo rodando rapidinho com seus exemplos. Sendo assim, vamos aprender como criar esses dados falsos e como seria retirar uma amostra dos seus dados.
CRIANDO TABELAS NO R
Abaixo, criamos um dataframe com 3 variáveis, sendo uma a chave de identificação (id), a outra uma variável com caracteres (var_char) e a outra uma variável numérica (var_num):
exemplo_1 = data.frame(id = c(1, 2, 3, 4), var_char = c("A", "B", "C", "D"), var_num = c(10, 20, 30, 40)) exemplo_
É possível, de forma mais ágil ainda, criar sequências de números, letras maiúsculas, letras minúsculas e até mesmo de meses:
exemplo_2 = data.frame(id = c(1:10), var_car = letters[1:10], VAR_CHAR = LETTERS[1:10], mes = month.abb[1:10]) exemplo_2
RETIRANDO AMOSTRAR DO DATAFRAME
Para criar amostras aleatórias, basta adaptar o código que vimos em Gerar uma amostra aleatória simples no R:
# variavel aleat sera amostra de numeros de 0 a 100 exemplo_3 = data.frame(id = c(1:10), aleat = sample(1:100, 10, replace=T)) exemplo_3
Simples, não?
Sempre que for utilizar alguma técnica mais complexa, teste em tabelas menores, que possibilitem que você visualize exatamente o que está sendo feito. Simule os cenários que você pode encontrar e veja se o que você fez atende a todos.
E aí, curtiu o post?
E aí? Gostou do conteúdo? Se inscreva para receber todas as novidades. Deixe seu e-mail em INSCREVA-SE na barra à direita, logo abaixo de pesquisar. E, por favor, não deixe de comentar, dar seu feedback e, principalmente, compartilhar com seus amigos. De verdade, isso faz toda a diferença. Além disso, você também pode acompanhar mais do meu trabalho seguindo a conta de Twitter @UniDosDados, no Instagram @universidadedosdados ou por alguma das redes que você encontra em Sobre o Estatsite / Contato, como meu canal de Youtube Canal Universidade dos Dados.
Aproveite e adquira sua camiseta de data science na LOJA DA UNIVERSIDADE DOS DADOS. Vai ficar estiloso e me ajudar neste projeto!
BONS ESTUDOS!