t de Student para comparar dos muestras independientes en R

La prueba t de Student es uno de los test más utilizados en estadística para comparar las observaciones de 2 grupos. Realizar una t de Student para comparar dos muestras independientes en R es extraordinariamente sencillo a partir del uso de la interfaz gráfica R Commander.

Quiero leer...

Por qué se llama t de Student y su relación con la cerveza Guinness

A todos los que nos gusta la Estadística hemos escuchado en algún momento hablar de la t de Student, ¿verdad? ¿Pero nos hemos preguntado alguna vez  por qué se llama t de Student a este … Leer más…

5 comments

El contraste de hipótesis de una t de Student es el que sigue:

Contraste de hipótesis de una t de Student

  • H0: ambos grupos presentan medias iguales y no tienen diferencias significativas.
  • H1: ambos grupos presentan medias diferentes y tienen diferencias significativas.

Sin embargo, antes de comenzar y lanzarnos al fango de realizar una t de Student, es necesario que nuestros datos cumplan unos requisitos.

Requisitos para realizar una t de Student

Es necesario que ambas muestras se distribuyan siguiendo una distribución normal y sus varianzas sean iguales.

Test de normalidad Shapiro-Wilk

Para constrastar la normalidad, vamos a usar el test de Shapiro-Wilk. Los resultados para ambas variables son:

[sourcecode lang=»r»] > shapiro.test(EXAMPLE$LONG1)

Shapiro-Wilk normality test

data: EXAMPLE$LONG1
W = 0.98143, p-value = 0.3219

> shapiro.test(EXAMPLE$LONG2)

Shapiro-Wilk normality test

data: EXAMPLE$LONG2
W = 0.97805, p-value = 0.2039
[/sourcecode]

Como podemos observar, el p-valor de ambas variables (0.3219 y 0.2039) se sitúa por encima de 0.05. Esto significa que aceptamos la hipótesis nula y consideramos que ambas se distribuyen siguiendo una distribución normal.

Test de homocedasticidad F de Fisher

Para contrastar la homocedasticidad (o igualdad de varianzas), usamos el test F de Fisher. El resultado es el siguiente:

[sourcecode lang=»r»] > var.test(MEDIDA ~ FACTOR, alternative=’two.sided’, conf.level=.95, data=EXAMPLE)

F test to compare two variances

data: MEDIDA by FACTOR
F = 1.3183, num df = 31, denom df = 31, p-value = 0.4461
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.6435104 2.7006123
sample estimates:
ratio of variances
1.318284
[/sourcecode]

Como podemos observar, el p-valor (0.4461) es mayor que 0.05, aceptando la hipótesis nula de igualdad de varianzas.

t de Student para comparar dos muestras independientes en R

Perfecto. Una vez llegados a este punto es que nuestros datos son normales y homocedásticos. Para realizar una t de Student para comparar dos muestras independientes en R Commander se hace siguiendo el siguiente esquema gráfico.

t de student para comparar dos muestras independientes en r

  • Paso 1. Introducimos los datos. Fíjense en que hay dos columnas, una con todas las observaciones y otra con los grupos. A continuación vamos a Statistics – Means – Independent samples t-test…
  • Paso 2. En la ventana que se despliega aparecen dos pestañas:
    • Data. Automáticamente reconoce la columna de los grupos (Groups (pick one)) y la columa de las observaciones (Response Variable (pick one)). Si no lo hace, introducirlo manualmente pinchando sobre la variable respectiva.
    • Options. Esta parte es muy importante. Debido a que hemos comprobado que tienen varianzas iguales, en Assume equal variances marcamos Yes. Podemos modificar también el nivel de confianza o hacer un test bilateral o de una cola.
  • Paso 3. Vemos resultados que se despliegan en la sección de Output.
[sourcecode lang=»r»] > t.test(MEDIDA~FACTOR, alternative=’two.sided’, conf.level=.95, var.equal=TRUE, data=EXAMPLE)

Two Sample t-test

data: MEDIDA by FACTOR
t = -2.0899, df = 62, p-value = 0.04073
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-3.97411351 -0.08838649
sample estimates:
mean in group LONG1 mean in group LONG2
72.81250 74.84375
[/sourcecode]

Como se puede observar, el p-valor es 0.04073. Esto indica que al ser menor de 0.05 rechazamos la hipótesis nula y podemos decir que existen diferencias significativas entre ambas longitudes.

Referencias

A continuación verá una relación de libros donde obtuve información sobre la t de student para comparar dos muestras independientes en R:

  • [easyazon_link identifier=»8436269551″ locale=»ES» tag=»losojosdeante-21″ cart=»n»]La Interpretación De Los Datos. Una Introducción A La Estadística Aplicada (CIENCIAS)[/easyazon_link]
  • [easyazon_link identifier=»8436255631″ locale=»ES» tag=»losojosdeante-21″ cart=»n»]Estadística Aplicada: Conceptos Básicos (EDUCACIÓN PERMANENTE)[/easyazon_link]
  • [easyazon_link identifier=»8436260937″ locale=»ES» tag=»losojosdeante-21″ cart=»n»]Estadística Básica Con R (GRADO)[/easyazon_link]
  • [easyazon_link identifier=»8436258614″ locale=»ES» tag=»losojosdeante-21″ cart=»n»]Estadística Aplicada Con R (VARIA)[/easyazon_link]

2 comentarios en «t de Student para comparar dos muestras independientes en R»

Deja un comentario