Como comparar colunas no spss

Em estudos de mercado, quer seja no desenvolvimento dum produto, quer seja  na escolha dum público-alvo duma campanha de marketing, pode interessar-nos saber se existem diferenças entre homens e mulheres na aquisição do nosso produto. Para tal, teremos de comparar a aquisição do produto por parte de homens e de mulheres.

Neste caso, temos uma variável que podemos chamar “Aquisição”  e que nos diz qual o valor despendido, no nosso produto, pelo inquirido. Na amostra teremos respostas de homens e mulheres. O que precisamos fazer, de seguida, é comparar o valor médio amostral da variável “Aquisição”, quer no grupo de homens, quer no grupo de mulheres.

A “Aquisição” é uma variável de razão: compreende valores semanais gastos no nosso produto que oscilam entre zero euros e 10 euros. Neste caso utiliza-se o teste t para duas amostras independentes.  Os comandos são os que se seguem na figura abaixo.

Como comparar colunas no spss

Abre-se, de seguida, uma janela exemplificada na imagem em baixo. No campo Test Variable coloca-se a variável em que pretendemos analisar as diferenças e no campo Group Variable deve colocar-se a variável que identifica os grupos em teste. Neste caso o género é a variável grupo que pretendemos analisar. Devendo ser definidos os grupos em teste, carrega-se no botão Define Groups, que abre uma nova janela onde se define o grupo 1 com 0 (masculino)  e o grupo 2 com 1  (feminino), de acordo com a codificação anterior da variável na base de dados.

Como comparar colunas no spss

O output do teste é apresentado na imagem abaixo. Na primeira tabela são apresentados os casos do grupo masculino e do grupo feminino, o valor médio despendido no nosso produto  nos grupos masculino e feminino e os respectivos valores de desvio padrão.

Na segunda tabela, são apresentados os valores do teste de Levene e do teste t. O teste de Levene permite-nos averiguar da homogeneidade das variâncias. Neste caso, conclui-se que as variâncias são diferentes nos dois grupos, uma vez que a significância associada ao teste é inferior a 0,05. Uma vez que não se assume a homogeneidade das variâncias, optamos por utilizar os valores do teste t de Equal variances not assumed. Os resultados indicam que não existem diferenças entre homens e mulheres no valor semanal despendido no nosso produto. O teste não mostrou diferenças estatisticamente significativas para um intervalo de 95% de confiança (a significância associada ao teste t foi superior a 0,05).

Como comparar colunas no spss

Nota: para uma escolha mais criteriosa do teste a aplicar deve proceder-se à análise da distribuição das variáveis em estudo.

  1. 1. ANÁLISE ESTATÍSTICA NO GESME - Parte II SPSS – Tutorial para Iniciantes Profa. Rilva Lopes de Sousa-Muñoz
  2. 2. Statistical Package for Social Sciences (SPSS): Ferramenta informática que permite realizar cálculos estatísticos complexos e visualizar, em poucos segundos, os resultados.
  3. 3. Statistical Package for Social Sciences (SPSS): • É preciso saber que teste estatístico utilizar para responder às questões de pesquisa • É preciso saber interpretar corretamente os resultados do cálculo estatístico efetuado
  4. 4. Dificuldades Iniciais 1º: Inicialmente tudo parece complexo: como inserir dados, fazer análises, produzir tabelas e gráficos... 2º: Janelas com muitas opções 3º: Interpretação dos resultados: É preciso entender linguagem estatística 4
  5. 5. Dificuldades Iniciais 4º: Opções de análise: O que não viola os pressupostos estatísticos? 5º: Como apresentar os resultados? 5
  6. 6. PRÉ- PRÉ-REQUISITOS Conhecimentos mínimos em ambiente Windows Conhecimentos básicos em estatística descritiva e inferencial (Módulo MCO2/CCM/UFPB ou similar) 6
  7. 7. Objetivos desta apresentação sobre SPSS no GESME Passo-a-passo para execução dos comandos do software Linguagem estatística: O básico para leitura dos resultados Exercícios práticos com o SPSS Cada subgrupo de pesquisa do GESME deverá realizar a análise do seu próprio trabalho 7
  8. 8. Iniciando o SPSS Quando o SPSS é iniciado, é apresentada no ecrã uma imagem semelhante à figura ao lado A imagem contém a janela SPSS for Windows
  9. 9. Iniciando o SPSS Iniciar o manual (Run the tutorial) Construir uma nova base de dados (Type in data) Abrir uma base já existente (Open an existing data source) Abrir um outro tipo de arquivo (Open another type of file)
  10. 10. Interfaces do SPSS As janelas de uso mais frequente são: 1) Janelas de edição (SPSS Data Editor), compostas por duas sub-janelas: Janela 1: Data View: Mostra o conteúdo de uma base de dados permitindo inserir ou alterar dados.
  11. 11. Antes da introdução dos dados, é necessário criar e definir as variáveis Para criar uma nova variável basta clicar duas vezes seguidas sobre uma das etiquetas 'var', que se encontra no topo das colunas vazias da janela de edição, ou clicar na sub janela Variable View
  12. 12. Variable View: Além de permitir a criação das variáveis que compõem a base de dados, pode- se modificar as suas definições caso já existam.
  13. 13. Criação do banco de dados de uma pesquisa: Inserir dados As linhas da grelha de edição representam casos (pacientes) distintos As colunas representam as variáveis Os nomes das variáveis aparecem no início de cada coluna
  14. 14. Criação do banco de dados de uma pesquisa Columns: variables Rows: cases Under Data View 14
  15. 15. Criação do banco de dados de uma pesquisa 1. Clicar em Variable View 2. Type 4. Description 2.Type variable: variable name of variable nome da 3. Type: numeric or variável/coluna string (ex. Idade) 3.Type: Numeric, string, etc. 1. Click 4.Label: descrição this Window das variáveis. Enter variables 15
  16. 16. 1º Passo: Nome da Variável Em Name, escrever o nome da variável. O nome de cada variável tem que ser único, ou seja, não pode existir mais do que uma variável com o mesmo nome.
  17. 17. 2º Passo: Tipo de dados Para se definir o tipo de dados na célula correspondente à variável na coluna Type, clicar no botão de expansão da célula, e surgirá então a caixa de diálogo Variable Type. Do lado esquerdo pode- se escolher o tipo de dados relativos à variável a definir selecionando o círculo correspondente.
  18. 18. Tipo de mensuração da variável: Relembrando apresentação anterior (parte I) • O tipo de variável escolhida condiciona as oportunidades de análises descritiva e inferencial posteriores: Sexo: nominal – Frequências; qui-quadrado Grau de instrução: ordinal – Mediana; amplitude; Teste de Mann-Whitney Idade: Intervalar – Médias e desvio- padrão;Teste t 18
  19. 19. 3º Passo: LABEL - Etiqueta da variável A etiqueta para o nome da variável, atribuída na coluna Label, permite caracteres para identificar com mais detalhe o que a variável representa. A Figura mostra o exemplo da atribuição da etiqueta para a variável sexo.
  20. 20. 4º Passo: Etiquetas aos valores da variável Aqui Aqui digitar digitar o o rótulo valor
  21. 21. Criação do banco de dados de uma pesquisa Baseado na sua codificação 21
  22. 22. Codificar: Variável SEXO Exemplo: Código para “feminino” 2 SEXO Cod_SEX 1. MASCULINO 1 2. FEMININO 2 22
  23. 23. Variável PROCED (Procedência: Município) “Capital” 1 PROCED Códigos 1. CAPITAL 1 2. INTERIOR 2 1 23
  24. 24. 5º Passo: Valores omissos da variável (Missing Values) (Missing Values) Podemos ter dois tipos de valores omissos em uma pesquisa: devido ao fato de um indivíduo não ter dado uma resposta, ou quando a variável em questão não se aplica a esse indivíduo.
  25. 25. 5º Passo: Valores omissos da variável (Missing) Missing) Por exemplo, desconhecendo o sexo de um indivíduo, cria-se uma nova etiqueta 'Sexo desconhecido' com o valor '9' ou ‘99’ em Value Labels, de acordo com o passo anterior. Para indicar ao SPSS que esse valor é Como neste exemplo só omisso, na célula existe um valor omisso, correspondente à variável seleciona-se Discrete Missing na coluna Missing, clicar no Values da caixa de diálogo botão de expansão da Missing Values e digita-se o valor '9‘. Clique em Ok para célula, surgirá então a caixa finalizar a atribuição do valor '9' de diálogo Missing Values como omisso.
  26. 26. 6º Passo: Formato da coluna da variável Para alterar o tamanho da coluna de uma variável, deverá clicar na célula correspondente à variável na coluna
  27. 27. 6º Passo: Formato da coluna da variável Para alterar o alinhamento de uma variável, deverá clicar na célula correspondente à variável na coluna Align da sub janela Variable View. Aparecerá nessa célula uma seta que quando seleccionada torna possível a escolha do alinhamento da variável para à esquerda 'Left', para à direita 'Right' ou para o centro 'Center’.
  28. 28. 7º Passo: Definir o tipo de variável Existem três tipos de variáveis admitidas pelo SPSS: as variáveis do tipo nominal e ordinal são ambas tratadas como categóricas nos procedimentos de feitura de tabelas e gráficos.
  29. 29. Como analisar os dados? Estatística descritiva Estatística inferencial Cada janela do SPSS tem a sua barra de menus com as suas próprias opções, disponíveis no topo de cada janela do SPSS. Os menus Analyze e Graphs estão disponíveis em todas as janelas, tornando então mais fácil produzir novos resultados sem ter de trocar de janela.
  30. 30. Estatística descritiva Distribuição de frequências Percentual e percentis (quartis) Medidas de tendência central: Média, mediana Medidas de dispersão: desvio- padrão, amplitude, valores máximo e mínimo 30
  31. 31. Estatística Descritiva Analyze Descriptive statistics Frequency 31
  32. 32. Caixa de diálogo de variáveis As variáveis são selecionadas de uma lista à esquerda Clicar nas variáveis de interesse e movê- las para a caixa à direita 3 May 1999 34
  33. 33. 35
  34. 34. Janela de resultados Output Distribuição de frequências Race of Respondent Valid Cumulative Frequency Percent Percent Percent Valid White 1264 83,3 83,3 83,3 Black 204 13,4 13,4 96,8 Other 49 3,2 3,2 100,0 Total 1517 100,0 100,0 Region of the United States Valid Cumulative Frequency Percent Percent Percent Valid North East 679 44,8 44,8 44,8 South East 415 27,4 27,4 72,1 West 423 27,9 27,9 100,0 Total 1517 100,0 100,0 36
  35. 35. Medidas de tendência central 3 May 1999 37
  36. 36. Frequências Apgar 1 minute score Valid Cumulative Frequency Percent Percent Percent Valid 0 8 1.2 1.9 1.9 1 4 .6 .9 2.8 2 2 .3 .5 3.3 3 3 .5 .7 4.0 4 11 1.7 2.6 6.6 5 9 1.4 2.1 8.7 6 13 2.0 3.1 11.8 7 38 5.7 9.0 20.8 8 170 25.6 40.1 60.8 9 145 21.8 34.2 95.0 10 21 3.2 5.0 100.0 Total 424 63.9 100.0 Missing System 240 36.1 Total 664 100.0 3 May 1999 38
  37. 37. Output: Medidas de tendência central Mediana: o ponto que divide a distribuição de Statistics freqüência ao meio em dois pólos de igual Age of Respondent tamanho (idade = 41) N Valid 1514 Missing 3 Média: o centro de Mean 45,63 gravidade da distribuição, calculado Median 41,00 pela soma dos valores Mode 35 das observações dividido pelo número de observações (idade = 45,6) 39
  38. 38. Medidas de dispersão Desvio padrão: medida de Statistics Average Average heterogeneidade female life expectancy male life expectancy na mesma escala N Valid 109 109 Mean Missing 0 70,16 64,92 0 da medida Median Mode 74,00 75a 67,00 73 (heterogeneidade Std. Deviation Variance 10,57 111,76 9,27 85,98 média ≈ 11 anos Range Minimum 39 43 35 41 para mulheres e ≈ Maximum 82 a. Multiple modes exist. The smallest value is shown 76 9 anos para homens) 40
  39. 39. Amount spent 80 60 40 20 Frequency Std. Dev = 115.42 Mean = 404.5 0 N = 779.00 10 15 20 25 30 35 40 45 50 55 60 65 70 75 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Amount spent
  40. 40. Relação entre variáveis categóricas O cruzamento é uma forma de estudar a relação entre duas ou mais variáveis. O resultado é uma tabela cruzada que mostra os casos que têm uma combinação particular de valores entre duas ou mais variáveis Comandos: Statistics...Sumarize.... Crosstabs...[variáveis] 42
  41. 41. Correlação entre variáveis categóricas, ordinais e intervalares Correlacionar duas variáveis O resultado é uma tabela e um gráfico mostrando a magnitude e direção da associação entre as variáveis Comandos: Statistics....... Correlate ...[variáveis] 43
  42. 42. Clicar Analyze- Correlate- Bivariate Mover as duas variáveis de interesse para a caixa à direita e clicar em OK 44
  43. 43. Output: janela de resultados 45
  44. 44. Correlações Parciais Lista de variáveis a serem analisadas Variáveis de controle
  45. 45. Output - - - P A R T I A L C O R R E L A T I O N C O E F F I C I E N T S - - - Controlling for.. SIZE STYLE Medindo a correlação AMTSPENT USECOUP ORG AMTSPENT 1.0000 .2677 -.0116 de duas variáveis, mas ( 0) ( 775) ( 775) eliminando o efeito de P= . P= .000 P= .746 outras variáveis USECOUP .2677 1.0000 .0500 ( 775) ( 0) ( 775) P= .000 P= . P= .164 ORG -.0116 .0500 1.0000 ( 775) ( 775) ( 0) P= .746 P= .164 P= . (Coefficient / (D.F.) / 2-tailed Significance) " . " is printed if a coefficient cannot be computed
  46. 46. Caixa de diálogo do menu Analyze - comando Frequencies. Escolha da variável a analisar. Passagem da variável escolhida para a caixa da direita através da seta indicada na figura.
  47. 47. Para finalizar carregar em OK
  48. 48. Uma janela de resultados (SPSS Viewer ou Output) mostra os resultados automatica- mente
  49. 49. Gráficos no SPSS Menu Graphs > escolher o tipo de gráfico > inserir variáveis > OK 80 5 4 60 3 1 40 20 Count 2 0 1 2 3 4 5 OUTCOME
  50. 50. Menu Graphs
  51. 51. A janela de edição de gráficos (SPSS Chart Editor) mostra o gráfico a editar. Entre as funções mais frequentes, pode-se alterar o tipo de letra e seu tamanho, as cores, trocar eixos, inserir títulos, etc. Para abrir esta janela basta fazer duplo clique sobre o gráfico a editar na janela de resultados (SPSS Viewer ou Output).
  52. 52. Editar gráficos no SPSS
  53. 53. Figura 1 – Área sob a curva dos sinais clínicos que apresentaram valores entre 50% e 70% em relação à determinação do diagnóstico de doença hepática crônica em pacientes internados nas enfermarias do Hospital Universitário Lauro Wanderley, João Pessoa, Paraíba, Brasil, entre junho de 2010 e março de 2012.
  54. 54. Figura 2 – Correlação linear entre as pontuações medianas do questionário de cronotipo e do IQSP (Índice de Qualidade de Sono de Pittsburgh) em amostra de estudantes do curso de Medicina da Universidade Federal da Paraíba, Brasil.
  55. 55. Figura 1 - Tempo de permanência hospitalar em expostos e não-expostos à baixa qualidade aguda e crônica do sono noturno em amostra de pacientes hospitalizados no setor de Clínica Médica do Hospital Universitário Lauro Wanderley, João Pessoa, Paraíba, Brasil, entre 2010 e 2011.
  56. 56. Scatterplot: Scatterplot: diagrama de dispersão Graphs Scatter…. 3 May 1999 59
  57. 57. Scatterplot Escolher o tipo de diagrama Clicar Define 3 May 1999 60
  58. 58. Scatterplot Selecionar e mover as variáveis para os eixos X e Y para as caixas apropriadas Clicar OK 3 May 1999 61
  59. 59. Scatterplot - Output 5000 4000 Uma linha de regressão 3000 pode ser 2000 adicionada 1000 BTWT 0 10 20 30 40 50 60 70 BMI 3 May 1999 62
  60. 60. 5000 4000 3000 2000 1000 BTWT 0 10 20 30 40 50 60 70 BMI
  61. 61. Estatística Inferencial Exemplos de alguns dos testes estatísticos mais usados • Teste t • Testes de Mann-Whitney e Wilcoxon • Teste de qui-quadrado • Análise de variância (ANOVA) • Outras análises Risco relativo e odds ratio Análise de sobrevida Regressão Múltipla 64
  62. 62. Teste Qui-quadrado Qui- ANALYZE → DESCRIPTIVE STATISTICS → CROSSTABS Para ROWS, selecionar VI Para COLUMNS, selecionar VD STATISTICS → Clicar em CHI-SQUARE Regra: as células devem ter valores >5 (caso contrário: Teste Exato de Fischer)
  63. 63. Qui- Qui-quadrado – Crosstabs diferenças Apresenta distribuição das categorias da variável dependente em todas as classes da variável independente Brasil Chile
  64. 64. Qui- Qui-Quadrado - Significância
  65. 65. Teste t • Menu Analyze > Compare means > escolher Independent-Samples T Test • Colocar a VI na caixa Test Variable (s) e a VD na Grouping Variable
  66. 66. Teste t • Como o teste t só compara dois grupos, é preciso indicá-los. • Botão Define - Colocar os códigos dos grupos a comparar, ou seja, 1 e2
  67. 67. Teste t: Output • Como o teste t assume que os desvios-padrão (ou a variância) dos dois grupos são iguais, no Output do SPSS aparece um teste (teste de Levene) para verificar esta assunção. • Neste caso aceita-se a hipótese nula de que os desvios-padrão são iguais: homogeneidade
  68. 68. Teste de Mann-Whitney Mann- Clicar em: ANALYZE → NONPARAMETRIC TESTS → 2 INDEPENDENT SAMPLES TEST VARIABLE: Selecionar a variável dependente (resposta) Para GROUPING VARIABLE, selecionar a variável independente Clicar em MANN-WHITNEY e OK
  69. 69. Mann- Mann-Whitney U Test No menu, clicar em Statistics Escolher Nonparametric Tests Clicar em 2 Independent Samples 3 May 1999 72
  70. 70. Mann- Mann-Whitney U Test Selecionar e mover ◦ Test Variable(s) ◦ Grouping Variable Clicar Define Groups 3 May 1999 73
  71. 71. Mann- Mann-Whitney U Test Inserir os valores dos grupos Clicar Continue Clicar OK 3 May 1999 74
  72. 72. Mann- Mann-Whitney U Test - Output Descriptive Statistics Std. N Mean Deviation Minimum Maximum Apgar 1 minute score 34 7.29 2.44 0 9 Smokes cigarettes? 47 .60 .50 0 1 Ranks Test Statisticsb Sum of Apgar 1 Smokes cigarettes? N Mean Rank Ranks minute Apgar 1 minute score no 14 19.89 278.50 score yes 20 15.82 316.50 Mann-Whitney U 106.500 Total 34 Wilcoxon W 316.500 Z -1.238 Asymp. Sig. (2-tailed) .216 Exact Sig. [2*(1-tailed a .245 Sig.)] a. Not corrected for ties. b. Grouping Variable: Smokes cigarettes? 3 May 1999 75
  73. 73. Teste de Wilcoxon Clicar em: ANALYZE → NONPARAMETRIC TESTS → 2 DEPENDENT SAMPLES TEST VARIABLE: Selecionar a variável dependente Para GROUPING VARIABLE, selecionar a variável independente Clicar em WILCOXON e depois em OK
  74. 74. Teste de Wilcoxon No menu, clicar Statistics Nonparametric Tests Clicar 2 Related Samples 3 May 1999 77
  75. 75. Mover as variáveis selecionadas (pares) para a caixa à direita Escolha o teste estatístico Clicar em OK... 3 May 1999 78
  76. 76. Output Ranks Sum of N Mean Rank Ranks Apgar 5 minute score - Negative Ranks 0a .00 .00 Apgar 1 minute score Positive Ranks 27b 14.00 378.00 Ties 7c Total 34 a. Apgar 5 minute score < Apgar 1 minute score b. Apgar 5 minute score > Apgar 1 minute score Test Statisticsb c. Apgar 1 minute score = Apgar 5 minute score Apgar 5 minute score - Apgar 1 minute score Z -4.631a Asymp. Sig. (2-tailed) .000 a. Based on negative ranks. b. Wilcoxon Signed Ranks Test 3 May 1999 79
  77. 77. ANOVA Analyze / Compare means / One-way ANOVA ANOVA in SPSS
  78. 78. ANOVA Caixa de diálogo
  79. 79. Risco relativo e Odds Ratio ANALYZE → DESCRIPTIVE STATISTICS → CROSSTABS Para ROWS, selecionar a variável independente (VI) Para COLUMNS, selecionar a variável dependente (VD) Em STATISTICS, clicar em RISK Abaixo: CELLS, clicar em OBSERVED e ROW PERCENTAGES Será necessário codificar os dados de desfecho (presente: 1; ausente: 2) e exposição (presente: 1; ausente: 2)
  80. 80. Sugestões de leitura e vídeo sobre o SPSS Manuais SPSS Base for Windows - User Guide Sites www.spss.com http://www.ats.ucla.edu/stat/spss/ YouTube http://www.youtube.com/watch?v=eTHvlEz S7qQ 83
  81. 81. Sugestões de leitura sobre o SPSS Texas A & M- a huge selection of helpful movies http://www.stat.tamu.edu/spss.php UCLA- SPSS 12.0 Starter Kit (useful movies, FAQs, etc) http://www.ats.ucla.edu/stat/spss/sk/default.htm Indiana University- Getting Started (useful instructions with screenshots) http://www.indiana.edu/~statmath/stat/spss/win/ University of Toronto- A Brief Tutorial (screenshots, instructions and basic stats) http://www.psych.utoronto.ca/courses/c1/spss/page1.htm Central Michigan- Tutorials and Clips (movies, screenshots, instructions- slow loading but good) http://calcnet.mth.cmich.edu/org/spss/toc.htm SPSS Statistics Coach and Tutorial (under Help) as well as the ZU library Online Statistics Textbook http://www.statsoft.com/textbook/stathome.html 84