Test estadísticos para comparar muestras: cuadro comparativo

En muchas ocasiones, el hecho de querer comparar las medias de dos o más muestras hace que tengamos que lidiar con test estadísticos de diferentes nombres y con diferentes requisitos. ¿Cuál usar? ¿cuándo? ¿por qué? Con ese motivo, he decidido diseñar un esquema comparativo básico para poder escoger en cada caso qué test estadísticos realizar para obtener resultados fiables. Para ello, este cuadro comparativo de test estadísticos para comparar muestras espero que sea útil y sencillo de entender, sobre todo cuando estamos permanentemente rodeados de muchos nombres de test extraños. Es la manía de los estadísticos de poner su nombre a lo que describen…

Test estadísticos para comparar muestras: cuadro comparativo

Es muy importante señalar que aprenderemos todos estos tests utilizando el lenguaje de programación de R. Pero antes de usar este software, tenemos que conocer cuándo hay que usar un test u otro, para obtener resultados plenamente fiables y ser estrictos a nivel metodológico.

Test estadísticos para comparar muestras en R

Normalidad e igualdad de varianzas

Antes de querer aplicar test estadísticos para comparar las medias, es básico saber si las muestras provienen de una distribución normal (Normalidad) y si presentan en conjunto igualdad de varianzas (Homocedasticidad):

  1. Normalidad: se aplica el test de Shapiro-Wilk sobre cada una de las muestras que queramos comparar. Si tenemos 4 muestras por ejemplo, tendremos 4 p-valores del test, cada uno de su muestra.
  2. Homocedasticidad: determina si las varianzas entre las muestras a comparar son iguales. Por lo tanto, sólo se aplica el test 1 vez para todas las muestras. En este caso, dependiendo del número de muestras, se usa un test u otro:
    1. Dos muestras: se aplica el test F de Fisher.
    2. Más de dos muestras: se aplica el test de Bartlett.

Test paramétricos y no paramétricos

Una vez determinados los dos pasos previos (normalidad y homocedasticidad), aplicamos los test de comparación de medias dependiendo de si los cumplen o no:

  1. Test paramétricos: las muestras son normales y homocedásticas. Dependiendo del número de muestras, se usa un test u otro:
    1. Dos muestras: se aplica el test Welch (T test).
    2. Más de dos muestras: se aplica el test de ANOVA.
  2. Test no paramétricos: no se cumple alguno de los requisitos de normalidad y/o homocedasticidad.
    1. Dos muestras: se aplica el test Wilcoxon-Mann-Whitney. En ocasiones se pueden ver como test de Wilcoxon o test de Mann-Whitney, por separado.
    2. Más de dos muestras: se aplica el test de Kruskal-Wallis.

En el caso de que las muestras no sean normales y/o homocedásticas, pueden transformarse todas las variables (en logaritmos, por ejemplo) y volver a testear si con la transformación se han convertido en normales y/o homocedásticas.

Véis que si toda la información y los test están ordenados y estructurados, no es difícil seleccionar de un modo óptimo los test estadísticos para comparar muestras.

Referencias

La interpretación de los datos. Una introducción a la estadística aplicada (LIBRO)

6 comentarios en “Test estadísticos para comparar muestras: cuadro comparativo

  1. La inferencia que se realiza sobre una variable transformada (p.e. logaritmo) para conseguir la normalidad de la misma ¿es aplicable sobre la variable original, sin trasformar? ¿Hay límites en esas transformaciones?

    • Hola José Gómez. Las inferencias que hagas sobre las variables transformadas serán sobre esas variables transformadas (no sobre la original).

Deja un comentario

*