Gerar uma amostra aleatória simples no R

Para gerar uma amostra aleatória simples no R a partir de um conjunto de dados que você possui, o modo mais fácil é com a função sample() já apresentada aqui no post Como gerar números aleatórios no R?. A única diferença é que será necessário colocar como primeiro argumento o vetor em questão:

y = rnorm(1:100) # vetor com numeros aleatorios
amostra = sample(y, 10, replace = FALSE) # amostra sem reposicao com n=10

Se o seu conjunto de dados for um data frame, uma tabela, muda um pouco, mas continua simples. O exemplo abaixo foi feito com a tabela cars que vem no próprio R:

cars[sample(nrow(cars), 10), ] # amostra com n=10

Se você está construindo um modelo e quer dividir em base treino e teste, o pacote Caret do R facilita bastante. O código abaixo separa em base treino e teste (na proporção 80%-20%) os dados da tabela iris – que também vem no R, assim como cars. Tive que chamar todas as bibliotecas manualmente porque aqui estava dando erro com a função createDataPartition() (por motivos que eu desconheço):

install.packages("caret", dependencies = c("Depends", "Suggests"))
#library(munsell)
library(ggplot2)
#library(ModelMetrics)
#library(recipes)
#library(assertthat)
#library(bindrcpp)
#library(glue)
#library(pkgconfig)
#library(DEoptimR)
library(caret)
trainIndex <- createDataPartition(iris$Species, p = .8,
list = FALSE,
times = 1)
irisTrain <- iris[ trainIndex,] #treino
irisTest <- iris[-trainIndex,] #teste

Leia também: Árvore de Decisão no R

E aí, curtiu o post?

E aí? Gostou do conteúdo? Se inscreva para receber todas as novidades. Deixe seu e-mail em INSCREVA-SE na barra à direita, logo abaixo de pesquisar. E, por favor, não deixe de comentar, dar seu feedback e, principalmente, compartilhar com seus amigos. De verdade, isso faz toda a diferença. Além disso, você também pode acompanhar mais do meu trabalho seguindo a conta de Twitter @UniDosDados, no Instagram @universidadedosdados ou por alguma das redes que você encontra em Sobre o Estatsite / Contato, como meu canal de Youtube Canal Universidade dos Dados.

Aproveite e adquira sua camiseta de data science na LOJA DA UNIVERSIDADE DOS DADOS. Vai ficar estiloso e me ajudar neste projeto!

BONS ESTUDOS!

2 comentários em “Gerar uma amostra aleatória simples no R”

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *