Esse post bem que poderia ser uma continuação do Primeiros passos no R Studio, pois trataremos de algumas coisas que você vai fazer assim que abrir o R e iniciar seus trabalhos, como escolher o diretório em que você vai salvar as figuras ou carregar os dados, saber as dimensões do arquivo externo que você carregou, etc., é bem útil. É também um pouco repetitivo, já vimos algumas dessas funções separadamente, mas é bom reforçar para quem não viu outros links.
Primeiro, vamos verificar como escolher o diretório em que iremos trabalhar. Isto é, em qual pasta vamos salvar os arquivos ou onde está localizado o arquivo que gostaríamos de carregar no R.
O mais fácil, no point and click do RStudio é ir no Source -> Set working directory -> Choose Directory e digitar a pasta em que estão / devem estar os arquivos relacionados ao projeto que você está trabalhando, como na figura abaixo:
Outra maneira de fazer isso, que eu acho mais elegante, é inserindo alguns comandos no código:
diretorio = "C:/Users/Yukio/Desktop/Modelo_1"; setwd(diretorio);
Dessa forma, toda vez que eu quiser importar ou salvar um arquivo neste diretório (ou em alguma subpasta existente), eu posso apenas iniciar o caminho com duas reticências:
## importar o arquivo txt dados na subpasta DataSet dados = read.table("../dados.txt", header=TRUE); ## salvar o gráfico 1 na pasta Modelo_1 jpeg("../grafico_1") ## salvar o grafico 2 na subpasta Graficos jpeg("../Graficos/grafico_2")
Agora que você já importou o arquivo, você provavelmente quer saber a quantidade de linhas e colunas, isso pode ser obtido com a função dim():
## dimensao dos dados (num de linhas e colunas) dim(dados);
Você terá como resposta dois valores, sendo o primeiro a quantidade de linhas e o segundo a quantidade de colunas. E como visualizar os dados em uma tabela, como se fosse no Excel? Basta utilizar a função View():
## visualizar o conjunto de dados View(dados);
Abrirá uma aba, exatamente como um Excel, contendo os dados.
Uma função bem relevante, que eu inclusive vou colocar em outros posts por conta de sua utilidade é a str(). Ela serve para saber o formato de cada variável da sua tabela:
## formato das variaveis (numeric, factor) str(dados); ## nome das colunas col(dados)
Agora que você já carregou seus dados no lugar ideal, você pode começar a tratá-los. Alguns dos posts que podem te ajudar com essa tarefa estão no link Programação em R.
E aí, curtiu o post?
E aí? Gostou do conteúdo? Se inscreva para receber todas as novidades. Deixe seu e-mail em INSCREVA-SE na barra à direita, logo abaixo de pesquisar. E, por favor, não deixe de comentar, dar seu feedback e, principalmente, compartilhar com seus amigos. De verdade, isso faz toda a diferença. Além disso, você também pode acompanhar mais do meu trabalho seguindo a conta de Twitter @UniDosDados, no Instagram @universidadedosdados ou por alguma das redes que você encontra em Sobre o Estatsite / Contato, como meu canal de Youtube Canal Universidade dos Dados.
Aproveite e adquira sua camiseta de data science na LOJA DA UNIVERSIDADE DOS DADOS. Vai ficar estiloso e me ajudar neste projeto!
BONS ESTUDOS!