Quando unimos duas ou mais colunas para criar uma nova, podemos criar um novo campo que sirva como chave única para identificar os indivíduos ou até facilitar buscas por palavras chaves. No post de hoje, vou mostrar como você pode unir colunas no SAS de algumas formas bem simples. Vamos lá!
Etiqueta: cientista de dados
Como obter a moda no R
Moda é uma medida de tendência central. A definição é simples: é o valor que aparece com maior frequência nos seus dados. Exemplo: a moda do conjunto {1,1,2,2,3,3,3,4} é 3. Hoje, vamos ver como obter essa métrica no R!
Gerar uma amostra aleatória simples no R
Para gerar uma amostra aleatória simples no R a partir de um conjunto de dados que você possui, o modo mais fácil é com a função sample() já apresentada aqui no post Como gerar números aleatórios no R?. A única diferença é que será necessário colocar como primeiro argumento o vetor em questão:
Introdução ao SQL
SQL (Structured Query Language) é a linguagem padrão utilizada para armazenar, manipular e recuperar informações de bancos de dados. Colocando de forma simples, é através do SQL que é possível criar e atualizar nossos dados através de um modelo relacional. Os maiores usuários da linguagem são os DBAs (Database Administrators), responsáveis por toda a gestão dos dados, desde criar tabelas até dar acesso às demais áreas (para os mais curiosos há um podcast brasileiro com foco nos DBAs chamado DatabaseCast).
Histograma no R
Fazer um histograma no R é bem simples, basta utilizar o comando hist() com a variável que você quer investigar a distribuição. No entanto, um gráfico detalhado pode necessitar de mais detalhes, seja uma mudança na cor ou a apresentação das medidas de tendência central. Este post apresentará os detalhes que são possíveis de acrescentar no seu histograma utilizando o R.
Construindo Funções em Python
Uma das maiores vantagens para quem programa é poupar tempo. E uma das melhores formas de se poupar tempo é criando funções que realizem tarefas mais recorrentes. No Python, isso é feito utilizando o def + parâmetros (se houver) + dois pontos. Veja alguns exemplos de funções:
Funções em R
Não lembrava que já tinha feito um post sobre funções em R e acabei escrevendo mais este aqui (já aconteceu outras vezes rs). Como já estava pronto, não tinha motivos para deletar. Deixo aqui então um post que serve de complemento ao Funções no R.
Tutorial: Manipulação e Análise de Dados em R
Esse é um pequeno tutorial para quem não tem muita familiriadade com o R. O foco é entender o que o R é capaz de fazer, mas não deixar de fora as explicações estatísticas (ainda que sejam breves). Se você nunca abriu o R, recomendo que passe primeiro por Primeiros passos no R (Studio) e em seguida volte aqui. Hoje, vamos abordar um problema desde o entendimento dos dados até uma breve modelagem estatística. Espero que gostem!
Entendendo seus dados em Python
Quando você importa alguma tabela em ambientes como o R e o Python, diferente de um Excel que está escancarado na sua cara, é preciso ter um conhecimento mínimo de algumas funções para entender o que há na tabela. Por exemplo, o que está nas primeiras linhas, o que está nas últimas ou qual o tipo de cada elemento. Este post é para isso.
5 modelos básicos de forecast no R
Há algumas formas básicas de se fazer projeções para valores futuros (forecast), diferentes dos modelos geralmente falados nesse blog, mas que podem ser úteis. A seguir, temos 5 métodos simples que fazem parte do pacote fpp do R (na verdade são parte do pacote forecast que é carregado junto).