domingo, 6 de março de 2011

7 Comparando dois grupos

 


7.1 Diferença entre médias de dois grupos

Na Seção 5.4, vimos como construir um intervalo de confiança para a média populacional $\mu$, de uma amostra aleatória de tamanho $n$. Lembre-se que este intervalo de confiança era da forma $\bar{x}
\pm t \times \mbox{SE}$ or ( $\bar{x} - t \times
\mbox{SE}$, $\bar{x} + t \times \mbox{SE}$). Agora consideremos a comparação das médias de das populações (por exemplo, machos e fêmeas) através da estimação das diferenças de médias e calculando um intervalo de confiança para esta diferença das médias.
Quando temos amostras independentes de cada uma de duas populações, podemos sumarizá-las pelas suas médias, desvios padrão e tamanhos amostrais. Denote estas medidas por $\bar{x}_1$, $s_1$, $n_1$ para a amostra um e $\bar{x}_2$, $s_2$, $n_2$ para a amostra dois. Denote as correspondentes médias populacionais e desvios padrão $\mu_1$, $\mu_2$, $\sigma_1$ e $\sigma_2$ respectivamente.
Para os dados de alturas dos estudantes da página 13, vamos comparar a altura média dos estudantes do sexo masculino com as dos sexo feminino. Seja os grupo dos homens a amostra um, e o grupo das mulheres a amostra dois. As alturas foram medidas em centímetros e as medidas sumárias foram como segue:
$\bar{x}_1=178.85$,   $s_1=7.734$,   $n_1=20$,
$\bar{x}_2=164.09$,   $s_2=9.750$,   $n_2=17$.
Agora claramente uma estimativa natural da diferença entre médias na população, $\mu_1-\mu_2$, é dada pela diferença nas médias amostrais:

\begin{displaymath}
\bar{x}_1 - \bar{x}_2,
\end{displaymath}


e para nossos dados esta é $178.85- 164.09 = 14.76$. Agora o que precisamos é um erro padrão para esta estimativa para que possamos construir um intervalo de confiança ou realizar um teste da hipótese nula H$_0$: $\mu_1 - \mu_2 = 0$ versus H$_1$: $\mu_1-\mu_2 \neq 0$.

7.1.1 Erro padrão - assumindo desvios padrão iguais

Primeiramente, assumimos que os desvios padrão populacionais são os mesmos em cada grupo, i.e. $\sigma_1=\sigma_2=\sigma$. Podemos combinar os dois desvios padrões amostrais para formar uma estimativa combinada do desvio padrão. Atribuímos mais peso às amostras maiores. Este desvio padrão combinado $s_p$ é a raiz quadrada da variância combinada $s_p^2$ dada por

\begin{displaymath}s_p^2 = \frac{(n_1 - 1)s_1^2 + (n_2 - 1)s_2^2}{n_1 + n_2 -
2}.\end{displaymath}


Para nossos dados temos:

\begin{displaymath}s_p^2 = (19 \times 7.734^2 +16 \times 9.750^2 )/35 = 75.92801\end{displaymath}


então $s_p=\sqrt{75.92801} = 8.71$. Note que está entre $s_1$ e $s_2$. Se você obtiver um valor que não está entre estes valores então seus cálculos estão errados.
Agora podemos calcular o erro padrão das diferenças nas médias como

\begin{displaymath}
\mbox{SE} = s_p
\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}.
\end{displaymath}


a qual para nossos dados é $ 8.71 \times \sqrt ( 1/20 +1/17) = 2.87$kg.

7.1.2 I.C. para a diferença entre médias assumindo desvios padrão iguais

Um intervalo de confiança para $\mu_1-\mu_2$ é dado por

\begin{displaymath}
\left(
(\bar{x}_1 - \bar{x}_2) - t \times \mbox{SE}, \quad
(\bar{x}_1 - \bar{x}_2) + t \times \mbox{SE}
\right),
\end{displaymath}


onde t é escolhido apropriadamente. Quando os tamanhos amostrais são grandes um intervalo de confiança aproximado de 95% é obtido usando $t=1.96$.
Se os tamanhos amostrais não forem tão grandes então un intervalo exato de 95% de confiança deveria de ser calculado selecionando o valor de $t$ da tabela da disitrbuiçÃo $t$, com $n_1+n_2-2$ graus de liberdade e coluna $p=0.05$. Para um intervalo de 99% de confiança deveríamos selecionar o valor na coluna $p=0.01$.
Exemplo: Para os dados de altura, temos $n_1+n_2-2 =
20+17-2=35$, resultando $t=2.03$ para um intervalo de confiança de 95% (através de interpolação entre a linha 30 e 40). Um intervalo de confiança de 95% para a diferença nas médias é dado por:

\begin{displaymath}
( 14.76 - 2.03 \times 2.87, 14.76 + 2.03 \times 2.87) \quad = \quad
(8.93,20.59).\end{displaymath}


Estamos 95% confiantes que, em média, estudantes do sexo masculino são entre 9cm e 21cm mais do que as estudantes do sexo feminino.

7.1.3 Teste para a diferença das médias

Um teste para a diferença entre médias corresponde a um teste de H$_0$: $\mu_1 - \mu_2 = 0$. Seguindo o mesmo tipo de procedimento visto na Seção 6.
Nosso teste estatístico é:

\begin{displaymath}t = \frac{(\bar{x}_1 - \bar{x}_2) - 0 }{\mbox{SE}},
\end{displaymath}


que é a estimativa de $\mu_1-\mu_2$ menos o valor hipotético (zero neste caso) e tudo dividido pelo erro padrão.
Sob a hipótese nula, este segue uma distribuição $t$ com $n_1+n_2-2$ g.l. O valor obtido para $t$ (ignorando seu sinal) é comparado com os valores tabelados com os graus de liberdade aproriados, para obter um $p$-valor.
Para os nossos dados, temos $t= (14.76-0)/2.87 = 5.14$, e comparando este à linha 30 e 40 da tabela, vemos que devemos ter $p<0.001$.
Assumindo que nossas amostras foram amostras aleatórias de todos os estudantes, temos evidências bem fortes de a altura média dos estudantes do sexo masculino é diferente daquela das estudantes do sexo feminino.

7.1.4 I.C. para diferença de médias - desvios padrão diferentes

Uma regra prática é que os desvios padrão populacionais $\sigma_1$ e $\sigma_2$ podem em geral ser assumidas iguais se a razão do maior desvio padrão amostral para o menor for menor do que 2 ou 3. Além disso a suposição de variâncias iguais pode ser grosseiramente avaliada através de historgramas dos dados. Testes formais estão disponíveis se necessário.
Se os desvios padrão populacionais não puderem ser assumidos iguais, usamos uma outra fórmula para o erro padrão de $\bar{x}_1 -
\bar{x}_2$, dado por

\begin{displaymath}
\mbox{SE} =
\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}.
\end{displaymath}


Note que esta abordagem é usada somente para grandes amostras.
A estaística de teste usando este SE não segue uma distribuição t sob a hipótese nula. Contudo, para tamanhos amostrais razoavelmente grandes (digamos ambos maiores do que 30), podemos comparar a estatística de teste acima com uma distribution Normal padrão (última linha da tabela $t$).
Em nosso exemplo, calculamos um erro padrão de 2.87 kg sob a suposição de igauldade de desvios padrão populacionais para ambos os grupos. A fórmula alternativa (a qual não assume desvios padrão populacionais iguais) resulta em

\begin{displaymath}
\mbox{SE} = \sqrt{\frac{(7.734)^2}{20} + \frac{(9.750)^2}{17}} = 2.93 \mbox{ kg}
\end{displaymath}


que praticamente não defire do valor prévio. Então o intervalo de confiança e o resultado de teste de hipótese seriam virtualmente os mesmos usando este erro padrão.


7.2 Amostras pareadas

Num estudo pareado, temos duas amostras mas cada observação da primeira amostra é pareada com uma observação da segunda amostra. Tal delineamento ocorre, por exemplo, num estudo de medidas feitas antes e depois no mesmo indivíduo ou num estudo de gêmeos (onde cada conjunto de gêmeos forma um dado pareado). Como esperado, as duas observações do mesmo indivíduo (ou de um conjunto de gêmeos) são mais prováveis de serem similares, e portanto não são considerados estatíticamente independentes.
Com dados pareados, podemos usar a seguinte notação:

\begin{eqnarray*}
x_{1i} &=& \mbox{measurement 1 on pair $i$},\\
x_{2i} &=& \mbox{measurement 2 on pair $i$}
\end{eqnarray*}




a então escrevemos as diferenças nas medidas de cada par como

\begin{displaymath}
d_{i} = x_{2i} - x_{1i}.
\end{displaymath}


Agora temos uma amostra de diferenças $d_i$, e podemos usar os métodos que já estamos familiares. Podemos calcular um intervalo de confainça para a diferença média e testar se a diferença média é igaul a um particular valor (usualmente zero) ou não. Nos referimos a tal teste como um paired t-test ao contrário do test-t para duas amostras acima.
Note que neste caso estamos interessados na diferença média enquanto que quando temos duas amostras independentes, estamos interessados na diferença nas médias. Ainda que numericamente estas quantidades são as mesmas, conceitualmente elas são diferentes.
Exemplo: A mudança nos níveis de um contaminante numa certa área do início ao final de seis meses de observação foram (em $\mu/l$):

\begin{displaymath}
\begin{array}{rrrrrr}
-1.5 & -0.6 & -0.3 & 0.2 & -2.0 & -1.2
\end{array}\end{displaymath}


A média e o desvio padrão são $-0.9$ e $0.81$ $\mu/l$ respectivamente. Então o erro padrão é $0.81/\sqrt{6} = 0.33$ $\mu/l$.
Podemos agora realizar um test-$t$ pareado para testar a hipótese nula de que a perda na concentração média é 0. Para isso calculamos

\begin{displaymath}
t = \frac{\bar{d}-0}{\mbox{SE}(\bar{d})} = \frac{-0.9}{0.33} =
-2.73.
\end{displaymath}


Note que este valor é negativo (porque a mudança média observada foi a redução na concentração do poluente -- um valor positivo seria um aumento na concentração do poluente). Observamos o valor absoluto da estatística de teste (2.73) na tabela, usando a linha com $n-1=5$ graus de liberdade.
A quinta linha da tabela mostra que $0.01 < p < 0.05$ (porque o valor 2.73 está entre os valores tabelados 2.571 e 4.032). Então, rejeitamos a hipótese nula ao nível de 5%. Existe evidência ao nível de 5% de que a área em estudo sofreu uma redução em média nos níveis do contaminante durante o período de seis meses.
Podemos adicionar à nossa conclusão o intervalo de confiança de 95% para a redução média nos níveis do contaminante: $-0.9 \pm 2.57 \times
0.33 = -0.9 \pm 0.85 = (-1.75,-0.05)$ Estamos 95% confiantes que a redução média nos níveis do contaminante está entre 0.05$\mu/l$ e 1.75$\mu/l$.


7.3 Comparando proporções

Voltando aos dados da página 38 acerca de um estudo investigando a existência de uma igualdade na proporção de machos de uma certa espécie em dois lagos distintos. As proporções observadas de machos foram 74.4% dentre 43 peixes capturados no primeiro lago e 60% dentre os 50 do segundo. Se construirmos intervalos de confiança para os percentuais correspondentes de machos na população (peixes da mesma espécie naqueles dois lagos), encontraríamos que podemos estar 95% confiantes de que o percentual está entre 61.4% e 87.4% no primeirop lago, e entre 46.4% e 73.6% no segundo.
Contudo, nesse tipo de experimento a idéia principal é comparar diretamente os dois lagos. Portanto gostariamos de calcular um intervalo de confiança de 95% para a diferença em proporções. Note contudo que isto é somente apropriado para grandes amostras, e desse modo quando a amostra é pequena devemos ser cautelosos para não super valorizar os resultados.

7.3.1 Intervalo de confiança para a diferença em proporções

Seja $p_1$ a verdadeira proporção populacional no grupo 1 (lago 1), se seja $p_2$ a proporção no grupo 2 (lago 2). Estamos interessados na diferença em proporções,

\begin{displaymath}p_2-p_1.\end{displaymath}


Estimativas de $p_1$ e $p_2$ são dadas por

\begin{displaymath}\hat{p}_1 = 0.744 \quad, \quad \hat{p}_2 = 0.600,\end{displaymath}


então uma estimativa da diferença em proporções é

\begin{displaymath}\hat{p}_2 -\hat{p}_1 = 0.744 - 0.600 = 0.144\end{displaymath}


O erro padrão desta diferença é

\begin{displaymath}
\mbox{SE} = \sqrt{ \frac{\hat{p}_1(1 - \hat{p}_1)}{n_1} + \frac{\hat{p}_2(1 - \hat{p}_2)}{n_2}}.
\end{displaymath}


Com isso podemos construir um intervalo de confiança da forma ususal, ou seja

\begin{displaymath}(\hat{p}_2 - \hat{p}_1) \pm 1.96 \times\mbox{SE}.\end{displaymath}



Então para os nossos dados temos


\begin{displaymath}
\mbox{SE} = \sqrt{ \frac{0.744 \times (1 - 0.744)}{43} + \frac{ 0.600
\times (1 - 0.600)}{50}} = 0.096.
\end{displaymath}


Portanto um intervalo de confiança aproximado de 95% para a diferença em proporções é dado por $0.144 \pm 1.96 \times 0.096$, o qual é $(-0.044,0.332)$, ou (-4.4%,33.2%). Estamos 95% confiantes que a verdadeira diferença percentual entre as proporções de peixes machos nos dois lagos está entre -4.4% e 33.2%.
Note que de acordo com este intervalo o valor zero é um valor plausível para as diferenças nos percentuais, e portanto não existem evidências estatísticas de que o percentual de peixes do sexo masculino diferem nos dois lagos.

7.3.2 Teste para a diferença de duas proporções

Podemos testar a hipótese nula H$_0$: $p_2-p_1=0$ versus a alternativa H$_1$: $p_2-p_1 \neq 0$ usando a estatística

\begin{displaymath}t=\frac{(\hat{p}_2 -\hat{p}_1)-0}{SE}\end{displaymath}


e comparando este valor com a tabela t com $\infty$ graus de liberdade.

7.4 Exercícios 6


  1. Um experimento (hipotético) sobre o efeito do álcool na habilidade perceptual motora é conduzido. 10 indivíduos são testado duas vezes, uma depois de ter tomado dois drinks e uma depois de tomado dois copos de água. Os dois testes foram realizados em dois dias diferentes para evitar influência do efeito do álcool. Metade dos indivíduos tomou a bebida alcoólica primeiro e a outra metade água. Os escores dos 10 indivíduos são mostrados abaixo. Escores mais altos refletem uma melhor performance. Deseja-se testar se a bebida alcoólica teve um efeito singificante. Use um nível de significância de 1%.
    ------------------------------------
                     indivíduo
           1  2  3  4  5  6  7  8  9  10
    ------------------------------------
    água   16 15 11 20 19 14 13 15 14 16
    álcool 13 13 12 16 16 11 10 15  9 16
    ------------------------------------
    

  2. Um estudo realizado para comparação entre duas lagunas quanto à salinidade em Bimini, Bahamas, obteve as seguintes observações (em partes por mil):
    --------------------
    laguna 1   laguna 2
    --------------------
    37.54      39.04
    37.01      39.21
    36.71      39.05
    37.03      38.24
    37.32      38.53
    37.01      38.71
    37.03      38.89
    37.70      38.66
    37.36      38.51
    36.75      40.08
    37.45
    38.85
    --------------------
    
    O que você conclui com base nestes dados?
  3. Deseja-se comparar os teores de Sr provenientes de amostras de carbonato obtidos a partir de dois métodos diferentes: I-fotômetro de chama; II-análise espectrográfica.
    ---------------------------------
    Espécimes    Método I   Método II
    ---------------------------------
    1            0.96       0.94
    2            0.96       0.98
    3            0.85       0.87
    4            0.86       0.84
    5            0.86       0.87
    6            0.89       0.93
    ---------------------------------
    
  4. As seguintes amostras aleatórias são medidas da capacidade de produção de calor (em milhões de calorias por tonelada) de especimes de carvão de duas minas:
    ------------------------------------
    mina 1   8400 8230 8380 7860 7930
    mina 2   7510 7690 7720 8070 7660
    ------------------------------------
    
    Use um teste de 0.05% de significância para testar se a diferença entre as capacidades médias de calor é significante.
  5. Um método de semeadura de nuvens foi bem sucedido em 57 dentre 150 tentativas, enquanto outro método foi eficaz em 33 dentre 100 tentativas. Ao nível de significância de 0.05% podemos concluir que o primeiro método é melhor do o segundo?

Nenhum comentário:

Postar um comentário