t de Student para comparar dos muestras independientes en R

La prueba t de Student es uno de los test más utilizados en estadística para comparar las observaciones de 2 grupos. Realizar una t de Student para comparar dos muestras independientes en R es extraordinariamente sencillo a partir del uso de la interfaz gráfica R Commander.

El contraste de hipótesis de una t de Student es el que sigue:

Contraste de hipótesis de una t de Student

  • H0: ambos grupos presentan medias iguales y no tienen diferencias significativas.
  • H1: ambos grupos presentan medias diferentes y tienen diferencias significativas.

Sin embargo, antes de comenzar y lanzarnos al fango de realizar una t de Student, es necesario que nuestros datos cumplan unos requisitos.

Requisitos para realizar una t de Student

Es necesario que ambas muestras se distribuyan siguiendo una distribución normal y sus varianzas sean iguales.

Test de normalidad Shapiro-Wilk

Para constrastar la normalidad, vamos a usar el test de Shapiro-Wilk. Los resultados para ambas variables son:

> shapiro.test(EXAMPLE$LONG1)

Shapiro-Wilk normality test

data: EXAMPLE$LONG1
W = 0.98143, p-value = 0.3219


> shapiro.test(EXAMPLE$LONG2)

Shapiro-Wilk normality test

data: EXAMPLE$LONG2
W = 0.97805, p-value = 0.2039

Como podemos observar, el p-valor de ambas variables (0.3219 y 0.2039) se sitúa por encima de 0.05. Esto significa que aceptamos la hipótesis nula y consideramos que ambas se distribuyen siguiendo una distribución normal.

Test de homocedasticidad F de Fisher

Para contrastar la homocedasticidad (o igualdad de varianzas), usamos el test F de Fisher. El resultado es el siguiente:

> var.test(MEDIDA ~ FACTOR, alternative='two.sided', conf.level=.95, data=EXAMPLE)

F test to compare two variances

data: MEDIDA by FACTOR
F = 1.3183, num df = 31, denom df = 31, p-value = 0.4461
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.6435104 2.7006123
sample estimates:
ratio of variances
1.318284

Como podemos observar, el p-valor (0.4461) es mayor que 0.05, aceptando la hipótesis nula de igualdad de varianzas.

t de Student para comparar dos muestras independientes en R

Perfecto. Una vez llegados a este punto es que nuestros datos son normales y homocedásticos. Para realizar una t de Student para comparar dos muestras independientes en R Commander se hace siguiendo el siguiente esquema gráfico.

t de student para comparar dos muestras independientes en r

  • Paso 1. Introducimos los datos. Fíjense en que hay dos columnas, una con todas las observaciones y otra con los grupos. A continuación vamos a Statistics – Means – Independent samples t-test…
  • Paso 2. En la ventana que se despliega aparecen dos pestañas:
    • Data. Automáticamente reconoce la columna de los grupos (Groups (pick one)) y la columa de las observaciones (Response Variable (pick one)). Si no lo hace, introducirlo manualmente pinchando sobre la variable respectiva.
    • Options. Esta parte es muy importante. Debido a que hemos comprobado que tienen varianzas iguales, en Assume equal variances marcamos Yes. Podemos modificar también el nivel de confianza o hacer un test bilateral o de una cola.
  • Paso 3. Vemos resultados que se despliegan en la sección de Output.
> t.test(MEDIDA~FACTOR, alternative='two.sided', conf.level=.95, var.equal=TRUE, data=EXAMPLE)

Two Sample t-test

data: MEDIDA by FACTOR
t = -2.0899, df = 62, p-value = 0.04073
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-3.97411351 -0.08838649
sample estimates:
mean in group LONG1 mean in group LONG2
           72.81250            74.84375

Como se puede observar, el p-valor es 0.04073. Esto indica que al ser menor de 0.05 rechazamos la hipótesis nula y podemos decir que existen diferencias significativas entre ambas longitudes.

Referencias

A continuación verá una relación de libros donde obtuve información sobre la t de student para comparar dos muestras independientes en R:

  • [easyazon_link identifier=”8436269551″ locale=”ES” tag=”losojosdeante-21″ cart=”n”]La Interpretación De Los Datos. Una Introducción A La Estadística Aplicada (CIENCIAS)[/easyazon_link]
  • [easyazon_link identifier=”8436255631″ locale=”ES” tag=”losojosdeante-21″ cart=”n”]Estadística Aplicada: Conceptos Básicos (EDUCACIÓN PERMANENTE)[/easyazon_link]
  • [easyazon_link identifier=”8436260937″ locale=”ES” tag=”losojosdeante-21″ cart=”n”]Estadística Básica Con R (GRADO)[/easyazon_link]
  • [easyazon_link identifier=”8436258614″ locale=”ES” tag=”losojosdeante-21″ cart=”n”]Estadística Aplicada Con R (VARIA)[/easyazon_link]

2 comentarios en “t de Student para comparar dos muestras independientes en R

Deja un comentario

*