Uma das perguntas mais comuns para quem estuda probabilidade ou é fã de jogos de azar: qual a probabilidade de sair o número X, pelo menos uma vez, ao jogarmos um dado n vezes?
Tratando Duplicidades no SAS
É comum encontrar campos duplicados em uma tabela. Seja porque algum join ou agrupamento que poderia ter sido melhor realizado (mesmo não trazendo informações erradas), por causa de algum erro de inserção da informação ou qualquer outra coisa. No SAS, há algumas maneiras práticas de tratar esse erro. Aqui você vai aprender a ordenar sua tabela com PROC SORT, exluir duplicidades com NODUPKEY, gerar uma tabela com os valores que estavam duplicados utilizando DUPOUT e excluir duplicidades por todos os campos com BY _ALL_.
Conversão texto para número no data step e proc sql
O jeito mais simples de converter de texto para número no data step é simplesmente multiplicar a coluna por 1:
Soma com condição no SAS: Agrupamentos com Proc Sql
O group by é um método bem tranquilo de agrupar os valores de uma coluna de acordo com os valores de outra coluna. Veja os três exemplos abaixo, onde queremos primeiro saber qual o número de vendas de cada marca, o número de vendas por estado e o número de vendas de cada marca em cada estado:
Qui-quadrado de Pearson e Coeficiente de Contingência
Complementando o post Análise Bidimensional para Variáveis Qualitativas, vamos entender agora uma medida quantitativa para entender como duas variáveis qualitativas se relacionam entre si.
Análise Bidimensional para Variáveis Qualitativas
Assim como podemos analisar bidimensionalmente variáveis quantitativas, podemos analisar variáveis qualitativas. Neste caso, ao invés de querer saber a relação entre duas quantidades, queremos saber a relação de duas categorias / características. Por exemplo, você pode estar interessado em saber a relação entre o grau de instrução do indivíduo e o sexo, cuja distribuição é apresentada na tabela abaixo:
Análise Bidimensonal para Variáveis Quantitativas
Análise bidimensional (ou bivariada) é a análise de duas variáveis em conjunto. Quando utilizamos medidas resumo como média, mediana e variância (como no post Estatística Descritiva), estamos analisando a variável de forma isolada. Porém, em muitos casos, é interessante entender como as variáveis interagem entre si.
Acompanhando a execução da macro no SAS
Estatísticos
😂😂😂😂😂😂
Ponto percentual ou porcentagem?
Percentual implica mudança relativa, por exemplo, quando temos 10 elementos e adicionamos 3, temos um incremento de 30% com relação ao valor inicial. No entanto, quando comparamos duas quantidades em porcentagem, temos uma ambiguidade. Por exemplo, se você tem 30% em um primeiro instante, e 60% em um segundo momento, você cresceu 100% (pois duplicou) ou 30% (60%-30%)?