Qual a probabilidade de tirar o número 1 jogando um dado duas vezes?

Uma das perguntas mais comuns para quem estuda probabilidade ou é fã de jogos de azar: qual a probabilidade de sair o número X, pelo menos uma vez, ao jogarmos um dado n vezes?

Leia mais…

Tratando Duplicidades no SAS

É comum encontrar campos duplicados em uma tabela. Seja porque algum join ou agrupamento que poderia ter sido melhor realizado (mesmo não trazendo informações erradas), por causa de algum erro de inserção da informação ou qualquer outra coisa. No SAS, há algumas maneiras práticas de tratar esse erro. Aqui você vai aprender a ordenar sua tabela com PROC SORT, exluir duplicidades com NODUPKEY, gerar uma tabela com os valores que estavam duplicados utilizando DUPOUT e excluir duplicidades por todos os campos com BY _ALL_.

Leia mais…

Soma com condição no SAS: Agrupamentos com Proc Sql

O group by é um método bem tranquilo de agrupar os valores de uma coluna de acordo com os valores de outra coluna. Veja os três exemplos abaixo, onde queremos primeiro saber qual o número de vendas de cada marca, o número de vendas por estado e o número de vendas de cada marca em cada estado:

Leia mais…

Qui-quadrado de Pearson e Coeficiente de Contingência

Complementando o post Análise Bidimensional para Variáveis Qualitativas, vamos entender agora uma medida quantitativa para entender como duas variáveis qualitativas se relacionam entre si.

Leia mais…

Análise Bidimensional para Variáveis Qualitativas

Assim como podemos analisar bidimensionalmente variáveis quantitativas, podemos analisar variáveis qualitativas. Neste caso, ao invés de querer saber a relação entre duas quantidades, queremos saber a relação de duas categorias / características. Por exemplo, você pode estar interessado em saber a relação entre o grau de instrução do indivíduo e o sexo, cuja distribuição é apresentada na tabela abaixo:

Leia mais…

Análise Bidimensonal para Variáveis Quantitativas

Análise bidimensional (ou bivariada) é a análise de duas variáveis em conjunto. Quando utilizamos medidas resumo como média, mediana e variância (como no post Estatística Descritiva), estamos analisando a variável de forma isolada. Porém, em muitos casos, é interessante entender como as variáveis interagem entre si.

Leia mais…

Acompanhando a execução da macro no SAS

Mostrei no post Acompanhando o processo no SAS utilizando o Sysecho como utilizar o comando sysecho para acompanhar um procedimento extenso, algo que leva muito tempo para ser executado ou com muitas etapas. Porém, seria interessante também fazer um acompanhamento parecido quando executamos uma macro.

Leia mais…

Ponto percentual ou porcentagem?

Percentual implica mudança relativa, por exemplo, quando temos 10 elementos e adicionamos 3, temos um incremento de 30% com relação ao valor inicial. No entanto, quando comparamos duas quantidades em porcentagem, temos uma ambiguidade. Por exemplo, se você tem 30% em um primeiro instante, e 60% em um segundo momento, você cresceu 100% (pois duplicou) ou 30% (60%-30%)?

Leia mais…