Criando dataframes e gerando amostras no R

Muitas vezes, se queremos praticar algo no R (ou outra linguagem), é interessante criarmos um conjunto de dados de mentira ou retirar uma amostra de um conjunto real. Se o dataset falso ou a amostra tiver menos observações, você não vai precisar demorar alguns longos minutos testando o que criou, você vai ver aquilo rodando rapidinho com seus exemplos. Sendo assim, vamos aprender como criar esses dados falsos e como seria retirar uma amostra dos seus dados.

CRIANDO TABELAS NO R

Abaixo, criamos um dataframe com 3 variáveis, sendo uma a chave de identificação (id), a outra uma variável com caracteres (var_char) e a outra uma variável numérica (var_num):

exemplo_1 = data.frame(id = c(1, 2, 3, 4),
var_char = c("A", "B", "C", "D"),
var_num = c(10, 20, 30, 40))

exemplo_

É possível, de forma mais ágil ainda, criar sequências de números, letras maiúsculas, letras minúsculas e até mesmo de meses:

exemplo_2 = data.frame(id = c(1:10),
var_car = letters[1:10],
VAR_CHAR = LETTERS[1:10],
mes = month.abb[1:10])
exemplo_2

RETIRANDO AMOSTRAR DO DATAFRAME

Para criar amostras aleatórias, basta adaptar o código que vimos em Gerar uma amostra aleatória simples no R:

# variavel aleat sera amostra de numeros de 0 a 100
exemplo_3 = data.frame(id = c(1:10),
aleat = sample(1:100, 10, replace=T))
exemplo_3

Simples, não?

Sempre que for utilizar alguma técnica mais complexa, teste em tabelas menores, que possibilitem que você visualize exatamente o que está sendo feito. Simule os cenários que você pode encontrar e veja se o que você fez atende a todos.

E aí, curtiu o post?

E aí? Gostou do conteúdo? Se inscreva para receber todas as novidades. Deixe seu e-mail em INSCREVA-SE na barra à direita, logo abaixo de pesquisar. E, por favor, não deixe de comentar, dar seu feedback e, principalmente, compartilhar com seus amigos. De verdade, isso faz toda a diferença. Além disso, você também pode acompanhar mais do meu trabalho seguindo a conta de Twitter @UniDosDados, no Instagram @universidadedosdados ou por alguma das redes que você encontra em Sobre o Estatsite / Contato, como meu canal de Youtube Canal Universidade dos Dados.

Aproveite e adquira sua camiseta de data science na LOJA DA UNIVERSIDADE DOS DADOS. Vai ficar estiloso e me ajudar neste projeto!

BONS ESTUDOS!

 

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *