A discussão a seguir foi retirada de Kendall . [2]
|
A estatística não paramétrica é o ramo da estatística que não se baseia apenas em famílias parametrizadas de distribuições de probabilidade (exemplos comuns de parâmetros são a média e a variância). As estatísticas não paramétricas baseiam-se em não ter distribuição ou em ter uma distribuição especificada, mas com os parâmetros da distribuição não especificados. As estatísticas não paramétricas incluem estatísticas descritivas e inferência estatística . Os testes não paramétricos são freqüentemente usados quando as suposições dos testes paramétricos são violadas. [1] O termo "estatística não paramétrica" foi definido de forma imprecisa das duas maneiras a seguir, entre outras. Estes incluem, entre outros: As estatísticas de pedidos , baseadas nas classificações de observações, são um exemplo dessas estatísticas. A discussão a seguir foi retirada de Kendall . [2]
Métodos não paramétricos são amplamente usados para estudar populações que assumem uma ordem de classificação (como críticas de filmes que recebem de uma a quatro estrelas). O uso de métodos não paramétricos pode ser necessário quando os dados têm uma classificação, mas não uma interpretação numérica clara , como na avaliação de preferências . Em termos de níveis de medição , os métodos não paramétricos resultam em dados ordinais . Como os métodos não paramétricos fazem menos suposições, sua aplicabilidade é muito mais ampla do que os métodos paramétricos correspondentes. Em particular, eles podem ser aplicados em situações em que menos se sabe sobre a aplicação em questão. Além disso, devido à confiança em menos suposições, os métodos não paramétricos são mais robustos . Outra justificativa para o uso de métodos não paramétricos é a simplicidade. Em certos casos, mesmo quando o uso de métodos paramétricos é justificado, os métodos não paramétricos podem ser mais fáceis de usar. Devido a essa simplicidade e à sua maior robustez, os métodos não paramétricos são vistos por alguns estatísticos como deixando menos espaço para uso impróprio e mal-entendidos. A aplicabilidade mais ampla e a robustez aumentada dos testes não paramétricos têm um custo: nos casos em que um teste paramétrico seria apropriado, os testes não paramétricos têm menos poder . Em outras palavras, um tamanho de amostra maior pode ser necessário para tirar conclusões com o mesmo grau de confiança. Os modelos não paramétricos diferem dos modelos paramétricos porque a estrutura do modelo não é especificada a priori, mas sim determinada a partir de dados. O termo não paramétrico não pretende implicar que tais modelos não possuam parâmetros, mas que o número e a natureza dos parâmetros são flexíveis e não fixados de antemão.
Os métodos estatísticos inferenciais não paramétricos (ou sem distribuição ) são procedimentos matemáticos para teste de hipóteses estatísticas que, ao contrário da estatística paramétrica , não fazem suposições sobre as distribuições de probabilidade das variáveis que estão sendo avaliadas. Os testes usados com mais frequência incluem
As primeiras estatísticas não paramétricas incluem a mediana (século 13 ou anterior, uso na estimativa de Edward Wright , 1599; ver Mediana § História ) e o teste de sinal por John Arbuthnot (1710) na análise da proporção de sexos humanos no nascimento (ver Teste de sinal § História ) [3] [4]
|