Para gerar uma amostra aleatória simples no R a partir de um conjunto de dados que você possui, o modo mais fácil é com a função sample() já apresentada aqui no post Como gerar números aleatórios no R?. A única diferença é que será necessário colocar como primeiro argumento o vetor em questão:
y = rnorm(1:100) # vetor com numeros aleatorios amostra = sample(y, 10, replace = FALSE) # amostra sem reposicao com n=10
Se o seu conjunto de dados for um data frame, uma tabela, muda um pouco, mas continua simples. O exemplo abaixo foi feito com a tabela cars que vem no próprio R:
cars[sample(nrow(cars), 10), ] # amostra com n=10
Se você está construindo um modelo e quer dividir em base treino e teste, o pacote Caret do R facilita bastante. O código abaixo separa em base treino e teste (na proporção 80%-20%) os dados da tabela iris – que também vem no R, assim como cars. Tive que chamar todas as bibliotecas manualmente porque aqui estava dando erro com a função createDataPartition() (por motivos que eu desconheço):
install.packages("caret", dependencies = c("Depends", "Suggests")) #library(munsell) library(ggplot2) #library(ModelMetrics) #library(recipes) #library(assertthat) #library(bindrcpp) #library(glue) #library(pkgconfig) #library(DEoptimR) library(caret) trainIndex <- createDataPartition(iris$Species, p = .8, list = FALSE, times = 1) irisTrain <- iris[ trainIndex,] #treino irisTest <- iris[-trainIndex,] #teste
Leia também: Árvore de Decisão no R
E aí, curtiu o post?
E aí? Gostou do conteúdo? Se inscreva para receber todas as novidades. Deixe seu e-mail em INSCREVA-SE na barra à direita, logo abaixo de pesquisar. E, por favor, não deixe de comentar, dar seu feedback e, principalmente, compartilhar com seus amigos. De verdade, isso faz toda a diferença. Além disso, você também pode acompanhar mais do meu trabalho seguindo a conta de Twitter @UniDosDados, no Instagram @universidadedosdados ou por alguma das redes que você encontra em Sobre o Estatsite / Contato, como meu canal de Youtube Canal Universidade dos Dados.
Aproveite e adquira sua camiseta de data science na LOJA DA UNIVERSIDADE DOS DADOS. Vai ficar estiloso e me ajudar neste projeto!
BONS ESTUDOS!
2 comentários em “Gerar uma amostra aleatória simples no R”