¿Son estadísticamente significativas las diferencias entre medias de dos o más muestras? Cuadro comparativo de los test estadísticos

Comparación de medias entre muestrasEn muchas ocasiones, el hecho de querer comparar las medias de dos o más muestras hace que tengamos que lidiar con test estadísticos de diferentes nombres y con diferentes requisitos. ¿Cuál usar? ¿cuándo? ¿por qué? Con ese motivo, he decidido diseñar un esquema comparativo básico para poder escoger en cada caso, qué test estadísticos realizar para obtener resultados fiables. En esta entrada, los hipervínculos de los test (*) enlazan con los tutoriales en este blog que describen cómo se realizan usando R commander.

Antes de querer aplicar test estadísticos para comparar las medias, es básico saber si las muestras provienen de una distribución normal (Normalidad) y si presentan en conjunto igualdad de varianzas (Homocedasticidad):

  1. Normalidad: se aplica el test de Shapiro-Wilk sobre cada una de las muestras que queramos comparar. Si tenemos 4 muestras por ejemplo, tendremos 4 p-valores del test, cada uno de su muestra.
  2. Homocedasticidad: determina si las varianzas entre las muestras a comparar son iguales. Por lo tanto, sólo se aplica el test 1 vez para todas las muestras. En este caso, dependiendo del número de muestras, se usa un test u otro:
    1. Dos muestras: se aplica el test F de Fisher.
    2. Más de dos muestras: se aplica el test de Bartlett.

Una vez determinados los dos pasos previos, aplicamos los test de comparación de medias dependiendo de si los cumplen o no:

  1. Test paramétricos: las muestras son normales y homocedásticas. Dependiendo del número de muestras, se usa un test u otro:
    1. Dos muestras: se aplica el test Welch (T test).
    2. Más de dos muestras: se aplica el test de ANOVA.
  2. Test no paramétricos: no se cumple alguno de los requisitos de normalidad y/o homocedasticidad.
    1. Dos muestras: se aplica el test Wilcoxon-Mann-Whitney. En ocasiones se pueden ver como test de Wilcoxon o test de Mann-Whitney, por separado.
    2. Más de dos muestras: se aplica el test de Kruskal-Wallis.

En el caso de que las muestras no sean normales y/o homocedásticas, pueden transformarse todas las variables (en logaritmos, por ejemplo) y volver a testear si con la transformación se han convertido en normales y/o homocedásticas.

Como siempre, cualquier comentario, aclaración o corrección, en los comentarios al final de esta entrada.

¡Viva el Software Libre!

6 thoughts on “¿Son estadísticamente significativas las diferencias entre medias de dos o más muestras? Cuadro comparativo de los test estadísticos

  1. La inferencia que se realiza sobre una variable transformada (p.e. logaritmo) para conseguir la normalidad de la misma ¿es aplicable sobre la variable original, sin trasformar? ¿Hay límites en esas transformaciones?

    • Hola José Gómez. Las inferencias que hagas sobre las variables transformadas serán sobre esas variables transformadas (no sobre la original).

Leave a Comment

*