Test de Welch en R: compara muestras con varianzas diferentes

El test de Welch es uno de los test más utilizados en estadística para utilizada para comparar las observaciones de 2 grupos. Realizar un test de Welch en R para comparar dos muestras normales con varianzas diferentes es extraordinariamente sencillo a partir del uso de la interfaz gráfica R Commander. El contraste de hipótesis de un test de Welch en R es el que sigue:

Contraste de hipótesis de un test de Welch en R

  • H0: ambos grupos presentan medias iguales y no tienen diferencias significativas.
  • H1: ambos grupos presentan medias diferentes y tienen diferencias significativas.

Sin embargo, antes de comenzar y lanzarnos al fango de realizar un test de Welch en R, es necesario que nuestros datos cumplan unos requisitos.

Requisitos para realizar un test de Welch en R

Es necesario que ambas muestras se distribuyan siguiendo una distribución normal y que sus varianzas sean diferentes (heterocedásticas).

Test de normalidad Shapiro-Wilk

Para constrastar la normalidad, vamos a usar el test de Shapiro-Wilk.

Test de homocedasticidad F de Fisher

Para contrastar la homocedasticidad (o igualdad de varianzas), usamos el test F de Fisher o el test de Levene.

Test de Welch en R para comparar dos muestras con varianzas diferentes

Suponiendo que en nuestro ejemplo los test anteriores de los requisitos indican que son muestras normales pero no tienen varianzas iguales procedemos a realizar el test de Welch. Para realizar un test de Welch en R para comparar dos muestras independientes usando la GUI R Commander, se procede siguiendo las instrucciones de la siguiente figura.

Test de Welch en R: comparar muestras normales con varianzas diferentes

  • Paso 1. Introducimos los datos. Fíjense en que hay dos columnas, una con todas las observaciones y otra con los grupos. A continuación vamos a Statistics – Means – Independent samples t-test…
  • Paso 2. En la ventana que se despliega aparecen dos pestañas:
    • Data. Automáticamente reconoce la columna de los grupos (Groups (pick one)) y la columa de las observaciones (Response Variable (pick one)). Si no lo hace, introducirlo manualmente pinchando sobre la variable respectiva.
    • Options. Esta parte es muy importante. Suponiendo que no tienen varianzas iguales (heterocedasticidad), en Assume equal variances marcamos No. Podemos modificar también el nivel de confianza o hacer un test bilateral o de una cola.
  • Paso 3. Vemos resultados que se despliegan en la sección de Output.
> t.test(MEDIDA~FACTOR, alternative='two.sided', conf.level=.95, var.equal=FALSE, 
+   data=EXAMPLE)

	Welch Two Sample t-test

data:  MEDIDA by FACTOR
t = 7.0296, df = 74.401, p-value = 8.457e-10
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 10.23859 18.33784
sample estimates:
mean in group HOMBRE  mean in group MUJER 
            189.4839             175.1957

Como podemos observar, el p-valor es menor de 0.05, por lo que aceptamos la hipótesis alternativa (o dicho de otro modo, rechazamos la hipótesis nula), por lo que podemos decir que en hombres y mujeres, dicha medida es distinta.

Referencias

Leave a Comment

*