Intervalo de confiança nada mais é do que uma estimativa de um parâmetro de uma população.
Lembra de quando falamos de inferência estatística no post Estatística, Estatística Descritiva, Inferência Estatística?
Você tem uma amostra de uma população (um subgrupo) e a partir dela faz inferências a respeito da população. Os intervalos de confiança fazem isso para os parâmetros dessa população, eles inferem os valores reais e consideram um determinado grau de incerteza. Você vai conseguir, a partir de um parâmetro do seu subgrupo, estimar um parâmetro da população inteira.
Por exemplo, vamos supor que você tenha uma população de 100 milhões de pessoas e quer saber a altura média dessa população. Porém, para saber com certeza qual é a altura média da população inteira, você teria que medir todas as 100 milhões de pessoas, o que é praticamente impossível. Então, o que você faz?
Você pega uma amostra dessa população, de por exemplo 1.000 habitantes e calcula a altura delas. Você vai querer inferir a partir da altura média desses 1.000 habitantes, a altura média da sua população. Ou seja, você quer pegar essas 1.000 pessoas e com base nas informações delas, descobrir uma informação da população inteira de 100 milhões de pessoas.
Mas você sabe que a altura média das pessoas da amostra não vai ser exatamente a altura média da população, mas provavelmente algum valor próximo disso. Aí que entra o intervalo de confiança, ele é o intervalo no qual a altura da sua população estará contida, dado um grau de incerteza.
Simples, não?
E como calcular o intervalo de confiança no SAS?
Vejamos a amostra a seguir de uma população:
data amostra;
input altura;
cards;
1.70
1.68
1.80
1.72
1.55
1.66
1.78
1.90
2.00
1.57
2.70
1.78
1.59
1.54
1.53
1.70
;
proc print;
var altura;
run;
Para calcular a média dessa população basta utilizar o proc summary com os parâmetros alpha, que será 1-nível de confiança, clm (confidence limits on the mean) e var seguido da variável em questão:
proc summary data=amostra print alpha=0.05 clm;
var altura;
run;
Aqui temos um outro método que produz os mesmos resultados, porém com outros resultados que falaremos em futuros posts:
proc ttest data=amostra alpha=0.05; var altura; run;
Oi Yukio
Este teste de normalidade que vc postou acima: “proc ttest data=amostra alpha=0.05; var altura; run;”
é um deste?
Anderson-Darling OU Kolmogorov-Smirnov OU Ryan- Joiner OU Shapiro-Wilk?
outra coisinha….
Tem como colocar o intervalo de confiança no qq plot deste comando?
Desde já agradeço
Cássia CP Mendicino