6.1 Introdução e notação
Em geral, intervalos de confiança são a forma mais informativa de apresentar os achados pricipais de um estudo. Contudo, algumas vezes existe um particular interesse em decidir sobre a verdade ou não de uma hipótese específica (se dois grupos têm a mesma média ou não, ou se o parâmetro populacional tem um valor em particular ou não). Teste de hipóteses fornece-nos a estrutura para que façamos isto. Veremos que intervalos de confiança e testes de hipóteses estão intimamente relacionados.6.1.1 Os pássaros migratórios engordam antes de migrar?
Considere os dados coletados pelo ornitologista na página 15. Achamos apropriado apresentar os dados na forma de um ladder plot. Agora é natural perguntar se em média estes pássaros engordam entre Agosto e Setembro. Somente 10 pássaros foram capturados e seu peso médio nas duas ocasiões foram 11.47 e 12.35 então o peso médio aumentou para esta amostra em particular. (Note que o mesmo conjunto de pássaros foram medidos ambas as vezes.) Podemos generalizar para o resto dos pássaros que não foram capturados? Será que esta diferença poderia ser devida simplesmente ao acaso?Queremos testar a hipótese nula (H) de que, em média, não existe mudança no peso dos pássaros. Assumiremos que os 10 pássaros foram uma amostra aleatória de todos os pássaros migradores daquela espécie e usaremos primeiramente o que aprendemos sobre intervalos de confiança para responder nossas perguntas.
Primeiro vamos calcular as mudanças de peso (Setembro-Agosto):
Seja a mudança média de peso na população. Então nossa hipótese nula H e a hipótese alternativa H podem ser escritas como segue:
Um procedimento útil é calcular um intervalo de confiança para a média populacional como descrito na Seção 5.5, e ver ser o intervalo inclui 0 como um valor plausível.
Agora , e para as diferenças, então
e um valor- de 2.262 é obtido da coluna e linha . Um intervalo de confiança de 95% para é portanto
O intervalo não contem o valor 0, fornecendo evidências contra a hipótese nula.
Podemos dizer: ``existem evidências significativas () de que, em média, os pássaros da espécie estudada mudam de peso de Agosto para Setembro. Estamos 95% confiantes de que em média os pesos aumentam por um montante entre 0.12 e 1.64 gramas.''
Mas e o intervalo de 99%? Será que ele conteria o valor 0? Este intervalo seria mais amplo e então é mais provável que ele contenha 0. Se ele não incluir 0, isto indicaria uma evidência ainda mais forte contra .
Calculando o intervalo de confiança exatamente da mesma forma, exceto que desta vez precisamos olhar na coluna para obter :
Como esperado, este é mais amplo, e agora inclui o valor 0.
Podemos agora dizer: ``não existem evidências significativas ao nível de 1% de que, em média, os pássaros da espécie estudada mudam de peso de Agosto para Setembro.''
O que nós acabamos de fazer foi conduzir um teste perfeitamente válido para a hipótese nula usando intervalos de confiança. Podemos fazer o teste mais rapidamente e obter exatamente as mesmas conclusões pelo seguinte procedimento:
- Calcule , o número de erros padrão que dista de 0.
- Compare este valor de com aqueles na linha da tabela.
- Para este exemplo, o qual está entre os valores nas colunas e . Então nosso valor deve corresponder a um entre estes e portanto devemos ter . ( é a probabilidade de observar um valor de tão grande ou mais extremo do que 2.61 se .)
6.2 Procedimento geral de teste
- Estabeleça a hipótese nula, H e a hipótese alternativa H.
- Decida qual oteste a ser usado, checando se este é válido para o seu problema.
- Calcule a estatística de teste, T.
- Encontre a probabilidade (p-valor) de observar um valor tão extremo ou maior do que T se a hipótese nula é de fato verdadeira. Você precisará se referir aos valores críticos nas tabelas estatísticas as quais fornecem -valores correspondendo aos valores das estatística de teste.
- Avalie a força da evidência contra H.(Quanto menor -valor, tanto mais evidência contra a hipótese nula.) Se necesário, decida se esta é evidência suficiente para rejeitar (ou não rejeitar) a hipótese nula.
- Estabeleça as conclusões e interpretação dos resultados.
6.3 Teste para uma média
Na Seção 5.1.1 conduzimos, através de um exemplo, o chamado teste-t para uma única média. Os passos principais de tal test-t para uma amostra aleatória de uma população com média são dados a seguir:- Estabeleça a hipótese nula, H , e a hipótese alternativa H .
- Calcule a média amostral e o desvio padrão amostral .
- Calcule o erro padrão, SE.
- Calcule a estatística de teste . Este é o número de erros padrão que dista do valor de hipótese .
- Encontre o -valor da distribuição , com graus de liberdade, da tabela usando os valores absolutos da estatística de teste.
- Estabeleça conclusões e interprete os resultados.
6.4 Teste para uma proporção
Agora suponha que tenhamos um valor hipotético para uma proporção. Podemos realisar um teste de H praticamente da mesma forma que o test-t acima. A dualidade com intervalos de confiança segue exatamente da mesma forma.Suponha que tenhamos uma amostra aleatória de tamanho de uma população de interesse onde a verdadeira proporção de membros numa categoria em particular é . A hipótese nula é H. Se o número observado na categoria de interesse é , então um teste da hipótese é como segue:
- Estabeleça a hipótese nula, H, e a hipótese alternativa H .
- Calcule a proporção amostral .
- Calcule o erro padrão, SE .
- Calcule , o número de erros padrão que dista do valor de hipótese .
- Encontre o -valor usando o valor absoluto da estatística de teste da tabela da distribuição normal (ou equivalentemente da com graus de liberdade).
6.4.1 Exemplo
Referindo-se ao exemplo da Seção 5.8, suponha que alguém tenha sugerido de experiências passadas que 60% das larvas de mosquito no lago deveriam ser da espécie Aedes detritus. Foram encontrados 60 desse tipo de uma amostra de 80. Os dados suportam esta hipóteste?6.5 Decisões e poder
Ao tomar uma decisão a favor ou contra uma hipótese existem dois tipos de erros que você pode cometer. Você pode rejeitar a hipótese nula quando de fato ela é verdadeira (erro tipo I) ou você pode falhar em rejeitar H quando de fato ela é falsa (erro tipo II). Existe um balanço entre esses dois tipos de erros, no sentido de que ao tentar-se minizar a possibilidade de um tipo, aumenta-se a probabilidade do outro. Frequentemente denotamos as probabilidades destes dois erros como e respectivamente.6.6 Dimensionamento de amostras
Vimos no Capítulo 5 e nas seções anteriores deste capítulo como construir intervalos e testes de hipóteses para os principais parâmetros populacionais. Em todos os, supusemos dado o nível de confiança desses intervalos e testes. Evidentemente, o nível de confiança deve ser fixado de acordo com a probabilidade de acerto que se deseja ter na estimação por intervalo e testes. Sendo conveniente, o nível de confiança pode ser aumentado até tão próximo de 100% quanto se queira, mas isso resultará em intervalos de amplitude cada vez maiores (e testes com poderes cada vez menores), o que significa perda de precisão na estimação. É claro que seria desejável termos intervalos com alto nível de confiança e pequena probabilidade de erro e grande precisão. Isso porém requer uma amostra suficientemente grande, pois, para fixo, confiança e precisão variam em sentidos opostos.Veremos a seguir como determinar o tamanho das amostras necessárias nos casos de estimação da média ou de uma proporção populacional. Vimos na Seção 5.4 que o intervalo de confiança de 95% para a média da população quando é conhecido tem semi-amplitude dada pela expressão
onde para uma confiança de 95%. Ora, o problema então resolvido foi, fixados o nível de confiança () e , determinar . Mas, é evidente dessa expressão que podemos resolver outro problema. Fixados, e o nível de confiança, determinar , que é o problema da determinação do tamanho de amostra necessário para se realizar a estimação por intervalo com a confiança e a precisão desejadas. Vemos imediatamente que
Essa será a expressão usada se for conhecido.
Não conhecendo o desvio-padrão da população, deveríamos subtituí-lo por sua estimativa e usar de Student na expressão acima. Ocorre porém que não tendo ainda sido retirada a amostra, não dispomos em geral do valor de . Se não conhecemos nem ao menos um limite superior para , a única solução será colher uma amostra-piloto de elementos para, com base nela obtermos uma estimativa de , empregando a seguir a expressão
Se , a amostra-piloto já terá sido suficiente para a estimação. Caso contrário, deveremos retirar, ainda, da população os elementos necessários à complementação do tamanho mínimo de amostra.
Procedemos de forma análoga se desejamos estimar uma proporção populacional com determinada confiança e dada precisão. No caso de população suposta infinita, da expressão
podemos obter
O obstáculo à determinação do tamanho de amostra por meio da expressão acima está em desconhecermos . Essa dificuldade pode ser resolvida através de uma amostra-piloto, analogamente ao caso descrito para a estimação de , ou analisando-se o comportamento do fator para . Vê-se da figura a seguir que é a expressão de uma parábola cujo ponto de máximo é .
Evidentemente, usando-se essa expressão corre-se o risco de se superdimensionar a amostra. Isso ocorrerá se for na realidade próximo de 0 ou 1. Se o custo envolvido for elevado e proporcional ao tamanho de amostra, é mais prudente a tomada de uma amostra-piloto.
6.6.1 Exemplos
- Qual o tamanho de amostra necessário para se estimar a média de uma população infinita cujo desvio-padrão é igual a 4, com 98% de confiança e precisão de 0,5?
- Qual o tamanho de amostra suficiente para estimarmos a proporção da área com solo contaminado que precisa de tratamento, com precisão de 0,02 e 95% de confiança, sabendo que essa proporção seguramente não é superior a 0,2?
6.7 Exercícios 5
- Exercícios 3, item 2. Teste a hipótese nula de que essa amostra provém de um corpo arenoso cuja média é .
- A fim de testar a ocorrência de estratificação gradacional num certo arenito, amostras foram coletadas na base e no topo de 7 estratos desse arenito. Aplicando-se o teste-t verificar se as diferenças entre o tamanho médio das partículas da base e do topo são significativas ou não.
- Foram feitas vinte medidas do tempo total gasto para a precipitação de um sal, em segundos, num dado experimento, obtendo-se:
- Deseja-se estimar a resitência média de certo tipo de peça com precisão de 2kg e 95% de confiança. Desconhecendo-se a variabilidade dessa resistência, roperam-se cinco peças, obtendo-se para elas os seguintes valores de sua resitência (em kg): 50,58,52,49,55. Com base no resultado obtido, determinou-se que deveriam ser rompidas mais quinze peças, a fim de se conseguir o resultado desejado. Qual sua opinião a respeito dessa conclusão?
- Exercícios 4, item 1. Realize um teste estatístico para ajudá-lo na decisão se você deve ou não acreditar que a moeda é balanceada. Qual a sua conclusão?
- Suponha que estejamos interessados em estimar a proporção de todos os motoristas que excedem o limite máximo de velocidade num trecho da rodovia entre Curitiba-São Paulo. Quão grande deve ser a amostra para que estejamos pelo menos 99% confiantes de que o erro de nossa estimativa, a proporção amostral, seja no máximo 0,04?
- Refaça o exercício anterior, sabendo que temos boas razões para acreditar que a proporção que estamos tentando estimar é no mínimo 0,65.
Nenhum comentário:
Postar um comentário