t de Student para comparar dos muestras independientes en R

La prueba t de Student es uno de los test más utilizados en estadística para comparar las observaciones de 2 grupos. Realizar una t de Student para comparar dos muestras independientes en R es extraordinariamente sencillo a partir del uso de la interfaz gráfica R Commander.

Por qué se llama t de Student y su relación con la cerveza Guinness

A todos los que nos gusta la Estadística hemos escuchado en algún momento hablar de la t de Student, ¿verdad? ¿Pero nos hemos preguntado alguna vez  por qué se llama t de Student a este … Leer más…

5 comments

El contraste de hipótesis de una t de Student es el que sigue:

Contraste de hipótesis de una t de Student

  • H0: ambos grupos presentan medias iguales y no tienen diferencias significativas.
  • H1: ambos grupos presentan medias diferentes y tienen diferencias significativas.

Sin embargo, antes de comenzar y lanzarnos al fango de realizar una t de Student, es necesario que nuestros datos cumplan unos requisitos.

Requisitos para realizar una t de Student

Es necesario que ambas muestras se distribuyan siguiendo una distribución normal y sus varianzas sean iguales.

Test de normalidad Shapiro-Wilk

Para constrastar la normalidad, vamos a usar el test de Shapiro-Wilk. Los resultados para ambas variables son:

[sourcecode lang=»r»] > shapiro.test(EXAMPLE$LONG1)

Shapiro-Wilk normality test

data: EXAMPLE$LONG1
W = 0.98143, p-value = 0.3219

> shapiro.test(EXAMPLE$LONG2)

Shapiro-Wilk normality test

data: EXAMPLE$LONG2
W = 0.97805, p-value = 0.2039
[/sourcecode]

Como podemos observar, el p-valor de ambas variables (0.3219 y 0.2039) se sitúa por encima de 0.05. Esto significa que aceptamos la hipótesis nula y consideramos que ambas se distribuyen siguiendo una distribución normal.

Test de homocedasticidad F de Fisher

Para contrastar la homocedasticidad (o igualdad de varianzas), usamos el test F de Fisher. El resultado es el siguiente:

[sourcecode lang=»r»] > var.test(MEDIDA ~ FACTOR, alternative=’two.sided’, conf.level=.95, data=EXAMPLE)

F test to compare two variances

data: MEDIDA by FACTOR
F = 1.3183, num df = 31, denom df = 31, p-value = 0.4461
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.6435104 2.7006123
sample estimates:
ratio of variances
1.318284
[/sourcecode]

Como podemos observar, el p-valor (0.4461) es mayor que 0.05, aceptando la hipótesis nula de igualdad de varianzas.

t de Student para comparar dos muestras independientes en R

Perfecto. Una vez llegados a este punto es que nuestros datos son normales y homocedásticos. Para realizar una t de Student para comparar dos muestras independientes en R Commander se hace siguiendo el siguiente esquema gráfico.

t de student para comparar dos muestras independientes en r

  • Paso 1. Introducimos los datos. Fíjense en que hay dos columnas, una con todas las observaciones y otra con los grupos. A continuación vamos a Statistics – Means – Independent samples t-test…
  • Paso 2. En la ventana que se despliega aparecen dos pestañas:
    • Data. Automáticamente reconoce la columna de los grupos (Groups (pick one)) y la columa de las observaciones (Response Variable (pick one)). Si no lo hace, introducirlo manualmente pinchando sobre la variable respectiva.
    • Options. Esta parte es muy importante. Debido a que hemos comprobado que tienen varianzas iguales, en Assume equal variances marcamos Yes. Podemos modificar también el nivel de confianza o hacer un test bilateral o de una cola.
  • Paso 3. Vemos resultados que se despliegan en la sección de Output.
[sourcecode lang=»r»] > t.test(MEDIDA~FACTOR, alternative=’two.sided’, conf.level=.95, var.equal=TRUE, data=EXAMPLE)

Two Sample t-test

data: MEDIDA by FACTOR
t = -2.0899, df = 62, p-value = 0.04073
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-3.97411351 -0.08838649
sample estimates:
mean in group LONG1 mean in group LONG2
72.81250 74.84375
[/sourcecode]

Como se puede observar, el p-valor es 0.04073. Esto indica que al ser menor de 0.05 rechazamos la hipótesis nula y podemos decir que existen diferencias significativas entre ambas longitudes.

Referencias

A continuación verá una relación de libros donde obtuve información sobre la t de student para comparar dos muestras independientes en R:

  • [easyazon_link identifier=»8436269551″ locale=»ES» tag=»losojosdeante-21″ cart=»n»]La Interpretación De Los Datos. Una Introducción A La Estadística Aplicada (CIENCIAS)[/easyazon_link]
  • [easyazon_link identifier=»8436255631″ locale=»ES» tag=»losojosdeante-21″ cart=»n»]Estadística Aplicada: Conceptos Básicos (EDUCACIÓN PERMANENTE)[/easyazon_link]
  • [easyazon_link identifier=»8436260937″ locale=»ES» tag=»losojosdeante-21″ cart=»n»]Estadística Básica Con R (GRADO)[/easyazon_link]
  • [easyazon_link identifier=»8436258614″ locale=»ES» tag=»losojosdeante-21″ cart=»n»]Estadística Aplicada Con R (VARIA)[/easyazon_link]

2 comentarios en «t de Student para comparar dos muestras independientes en R»

Deja un comentario

Vivaelsoftwarelibre.com se publica con licencia open source ¡obviamente! Apoya la cultura libre para que siga siendo un lugar de intercambio de conocimiento para tod@s ♥️

X