Como comparar as médias em subgrupos da mesma população

O erro padrão da média (SE Média) estima a variabilidade entre a amostra média que você obteria se você tivesse extraído repetidas amostras da mesma população. Considerando-se que o erro padrão da média estima a variabilidade entre as amostras, o desvio padrão mede a variabilidade dentro de uma única amostra.

Por exemplo, você tem um tempo médio de entrega de 3,80 dias, com um desvio padrão de 1,43 dias, a partir de uma amostra aleatória de 312 prazos de entrega. Estes números produzem um erro padrão da média de 0,08 dias (1,43 dividido pela raiz quadrada de 312). Se você extraiu várias amostras aleatórias do mesmo tamanho da mesma população, o desvio padrão dessas médias diferentes de amostra seria de cerca de 0,08 dias.

Use o erro padrão da média para determinar o quão precisamente a média da amostra estima a média da população.

Um valor menor do erro padrão da média indica uma estimativa mais precisa da média da população. Normalmente, um desvio padrão maior resulta em um erro padrão maior da média e uma estimativa menos precisa da média da população. A amostra de tamanho maior resulta em um erro padrão menor da média e uma estimativa mais precisa da média da população.

O Minitab utiliza o erro padrão da média para calcular o intervalo de confiança.

Em estudos de mercado, quer seja no desenvolvimento dum produto, quer seja  na escolha dum público-alvo duma campanha de marketing, pode interessar-nos saber se existem diferenças entre homens e mulheres na aquisição do nosso produto. Para tal, teremos de comparar a aquisição do produto por parte de homens e de mulheres.

Neste caso, temos uma variável que podemos chamar “Aquisição”  e que nos diz qual o valor despendido, no nosso produto, pelo inquirido. Na amostra teremos respostas de homens e mulheres. O que precisamos fazer, de seguida, é comparar o valor médio amostral da variável “Aquisição”, quer no grupo de homens, quer no grupo de mulheres.

A “Aquisição” é uma variável de razão: compreende valores semanais gastos no nosso produto que oscilam entre zero euros e 10 euros. Neste caso utiliza-se o teste t para duas amostras independentes.  Os comandos são os que se seguem na figura abaixo.

Como comparar as médias em subgrupos da mesma população

Abre-se, de seguida, uma janela exemplificada na imagem em baixo. No campo Test Variable coloca-se a variável em que pretendemos analisar as diferenças e no campo Group Variable deve colocar-se a variável que identifica os grupos em teste. Neste caso o género é a variável grupo que pretendemos analisar. Devendo ser definidos os grupos em teste, carrega-se no botão Define Groups, que abre uma nova janela onde se define o grupo 1 com 0 (masculino)  e o grupo 2 com 1  (feminino), de acordo com a codificação anterior da variável na base de dados.

Como comparar as médias em subgrupos da mesma população

O output do teste é apresentado na imagem abaixo. Na primeira tabela são apresentados os casos do grupo masculino e do grupo feminino, o valor médio despendido no nosso produto  nos grupos masculino e feminino e os respectivos valores de desvio padrão.

Na segunda tabela, são apresentados os valores do teste de Levene e do teste t. O teste de Levene permite-nos averiguar da homogeneidade das variâncias. Neste caso, conclui-se que as variâncias são diferentes nos dois grupos, uma vez que a significância associada ao teste é inferior a 0,05. Uma vez que não se assume a homogeneidade das variâncias, optamos por utilizar os valores do teste t de Equal variances not assumed. Os resultados indicam que não existem diferenças entre homens e mulheres no valor semanal despendido no nosso produto. O teste não mostrou diferenças estatisticamente significativas para um intervalo de 95% de confiança (a significância associada ao teste t foi superior a 0,05).

Como comparar as médias em subgrupos da mesma população

Nota: para uma escolha mais criteriosa do teste a aplicar deve proceder-se à análise da distribuição das variáveis em estudo.