Test de Welch en R: compara muestras con varianzas diferentes

El test de Welch es uno de los test más utilizados en estadística para utilizada para comparar las observaciones de 2 grupos. Realizar un test de Welch en R para comparar dos muestras normales con varianzas diferentes es extraordinariamente sencillo a partir del uso de la interfaz gráfica R Commander. El contraste de hipótesis de un test de Welch en R es el que sigue:

Contraste de hipótesis de un test de Welch en R

  • H0: ambos grupos presentan medias iguales y no tienen diferencias significativas.
  • H1: ambos grupos presentan medias diferentes y tienen diferencias significativas.

Sin embargo, antes de comenzar y lanzarnos al fango de realizar un test de Welch en R, es necesario que nuestros datos cumplan unos requisitos.

Requisitos para realizar un test de Welch en R

Es necesario que ambas muestras se distribuyan siguiendo una distribución normal y que sus varianzas sean diferentes (heterocedásticas).

Test de normalidad Shapiro-Wilk

Para constrastar la normalidad, vamos a usar el test de Shapiro-Wilk.

Test de homocedasticidad F de Fisher

Para contrastar la homocedasticidad (o igualdad de varianzas), usamos el test F de Fisher o el test de Levene.

Test de Welch en R para comparar dos muestras con varianzas diferentes

Suponiendo que en nuestro ejemplo los test anteriores de los requisitos indican que son muestras normales pero no tienen varianzas iguales procedemos a realizar el test de Welch. Para realizar un test de Welch en R para comparar dos muestras independientes usando la GUI R Commander, se procede siguiendo las instrucciones de la siguiente figura.

Test de Welch en R: comparar muestras normales con varianzas diferentes

  • Paso 1. Introducimos los datos. Fíjense en que hay dos columnas, una con todas las observaciones y otra con los grupos. A continuación vamos a Statistics – Means – Independent samples t-test…
  • Paso 2. En la ventana que se despliega aparecen dos pestañas:
    • Data. Automáticamente reconoce la columna de los grupos (Groups (pick one)) y la columa de las observaciones (Response Variable (pick one)). Si no lo hace, introducirlo manualmente pinchando sobre la variable respectiva.
    • Options. Esta parte es muy importante. Suponiendo que no tienen varianzas iguales (heterocedasticidad), en Assume equal variances marcamos No. Podemos modificar también el nivel de confianza o hacer un test bilateral o de una cola.
  • Paso 3. Vemos resultados que se despliegan en la sección de Output.
[sourcecode lang=”r”] > t.test(MEDIDA~FACTOR, alternative=’two.sided’, conf.level=.95, var.equal=FALSE,
+ data=EXAMPLE)

Welch Two Sample t-test

data: MEDIDA by FACTOR
t = 7.0296, df = 74.401, p-value = 8.457e-10
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
10.23859 18.33784
sample estimates:
mean in group HOMBRE mean in group MUJER
189.4839 175.1957
[/sourcecode]

Como podemos observar, el p-valor es menor de 0.05, por lo que aceptamos la hipótesis alternativa (o dicho de otro modo, rechazamos la hipótesis nula), por lo que podemos decir que en hombres y mujeres, dicha medida es distinta.

Referencias

  • [easyazon_link identifier=”8436269551″ locale=”ES” tag=”losojosdeante-21″ cart=”n”]La Interpretación De Los Datos. Una Introducción A La Estadística Aplicada (CIENCIAS)[/easyazon_link]
  • [easyazon_link identifier=”8436255631″ locale=”ES” tag=”losojosdeante-21″ cart=”n”]Estadística Aplicada: Conceptos Básicos (EDUCACIÓN PERMANENTE)[/easyazon_link]
  • [easyazon_link identifier=”8436260937″ locale=”ES” tag=”losojosdeante-21″ cart=”n”]Estadística Básica Con R (GRADO)[/easyazon_link]
  • [easyazon_link identifier=”8436258614″ locale=”ES” tag=”losojosdeante-21″ cart=”n”]Estadística Aplicada Con R (VARIA)[/easyazon_link]

3 comentarios en “Test de Welch en R: compara muestras con varianzas diferentes”

  1. Hola!
    Si tengo un conjunto de datos pequeños (12 observaciones) con dos grupos del mismo tamaño y muchas variables. Tres preguntitas me surgen:
    1. He analizado la normalidad con el test de Shapiro Wilk ¿Me recomiendas usar mejor Wilconxon?
    2. De todos los datos hay dos que no tienen distribución normal, pero al resto le hago el test de homogeneidad de varianzas y compruebo que hay 4 que son heterocedásticos con el test de Levene. Si quiero aplicar ANOVA para comprobar si las medias son iguales entre los grupos, los no normales como los comparo? y los heterocedásticos?
    ***¿Podría marcar la opción del test de welch de ANOVA para las variables con distribución normal y heterocedástico?

    Gracias
    Violeta

    Responder
  2. hola!
    Me podríais ayudar por favor,
    si tengo una base de datos de un análisis de un río en un punto, en pleamar y bajamar durante 6 meses de estudio. quiero comparar las dos mareas para ver su influencia en las variables. En total hay 12 observaciones para cada variable (seis de cada grupo). Al ser un tamaño muestral pequeño,
    a) utilizarias Wilconxon ¿no? . Si utilizas wilconxon, no haces ANOVA no? porque no es un test paramétrico.
    b)Test de Welch es para variables normales heterocedásticas?

    Gracias,

    Responder

Deja un comentario