Quando falamos de loop em computação, estamos nos referindo a uma sequência de comandos que são especificados uma vez no código, mas executados repetidas vezes sucessivamente. Saber como executar um loop significa economizar linhas de código e aumentar a eficiência do seu programa. Por isso, hoje vamos falar de loops no R. Continuar a ler “Loop no R”
Etiqueta: ciência de dados
Criando dataframes e gerando amostras no R
Muitas vezes, se queremos praticar algo no R (ou outra linguagem), é interessante criarmos um conjunto de dados de mentira ou retirar uma amostra de um conjunto real. Se o dataset falso ou a amostra tiver menos observações, você não vai precisar demorar alguns longos minutos testando o que criou, você vai ver aquilo rodando rapidinho com seus exemplos. Sendo assim, vamos aprender como criar esses dados falsos e como seria retirar uma amostra dos seus dados. Continuar a ler “Criando dataframes e gerando amostras no R”
Como retirar duplicidades no R
Sempre que você trabalha com um conjunto de dados é importante saber se ele tem alguma duplicidade. I.e., se algum elemento aparece mais de uma vez, sendo que não deveria. No R, a função mais trivial para retirar duplicidade na sua tabela, vetor, data frame, é a unique(). Continuar a ler “Como retirar duplicidades no R”
Formatação de Datas no SAS
Sim, continuamos aprendendo a lidar com formatações no SAS. Como sabemos, os dados nem sempre chegam no formato certo. Pode ter número em formato de texto, data em formato de número, além de outras complicações. Hoje, vamos complementar o post Formatando Datas no SAS com mais algumas dicas de como formatar os campos de data no SAS. Continuar a ler “Formatação de Datas no SAS”
Como converter caractere para número no SAS
E vamos de mais formatação de colunas no SAS. Hoje, quero complementar o post Tutorial: Trabalhando com Variáveis Texto no SAS. Abaixo, estão duas formas de converter caractere para número no SAS. Você vai ver que não tem segredo nenhum e que é super fácil de decorar a sintaxe. Vamos nessa!
Tutorial: Trabalhando com Variáveis Texto no SAS
Trabalhar com variáveis texto (aka string, var char) é muito comum e sempre necessário. Seja porque a variável não é em sua essência uma string – pode ser uma variável numérica que foi inserida como texto -, seja porque você quer retirar somente algumas partes desejáveis do campo, você sempre precisa dar uma trabalhada nelas.
Este post ensinará como algumas dicas do que pode ser feito com variáveis texto no SAS. Como extrair uma parte da string? Como deixar o campo com a letra inicial maiúscula? Como excluir espaços em branco? Essas e outras funções você encontrará logo abaixo.
Gráfico de Dispersão no Python
O gráfico de dispersão, ou scatterplot, é um gráfico no qual se traçam os diferentes pares de pontos (x, y) para entender como duas variáveis se relacionam. Em outras palavras, queremos saber se quando x, também observamos um aumento em y. Ou qualquer outra relação, claro. Nos exemplos abaixo, utilizaremos a biblioteca numpy para criar uma série aleatória e matplotlib para gerar o gráfico.
Carregando arquivos CSV no Python
Embora já tenha falado sobre isso em Primeiros passos em Python, acabei repetindo o tema. Este é um post bem curtinho e direto ao ponto, ensinando você a carregar no Python arquivos no formato CSV.
Concatenar campos no SAS
Quando unimos duas ou mais colunas para criar uma nova, podemos criar um novo campo que sirva como chave única para identificar os indivíduos ou até facilitar buscas por palavras chaves. No post de hoje, vou mostrar como você pode unir colunas no SAS de algumas formas bem simples. Vamos lá!
Como obter a moda no R
Moda é uma medida de tendência central. A definição é simples: é o valor que aparece com maior frequência nos seus dados. Exemplo: a moda do conjunto {1,1,2,2,3,3,3,4} é 3. Hoje, vamos ver como obter essa métrica no R!