t de Student para comparar dos muestras apareadas en R

La prueba t de Student es uno de los test más utilizados en estadística para utilizada para comparar las observaciones de 2 grupos. Realizar una t de Student para comparar dos muestras apareadas en R es extraordinariamente sencillo a partir del uso de la interfaz gráfica R Commander.

Pero antes de comenzar a explicar cómo se hace, vamos a definir qué son las muestras apareadas. Dos medidas están apareadas cuando se mide una variable en dos ocasiones como resultado de haber aplicado algún cambio. Pongamos un ejemplo para verlo más claro. Supongamos que estamos dando un tratamiento para favorecer el crecimiento de pelo. Tenemos unos individuos y antes de darles el tratamiento les medimos la densidad de pelos por centímetro cuadrado. Después les aplicamos el tratamiento y volvemos a medir esa variable sobre esos mismos individuos. Es decir, la variable densidad de pelos por centímetro cuadrado se mide dos veces en cada individuo. Están relacionadas o apareadas porque se miden sobre el mismo ejemplar.

En estos enlaces podréis conocer cómo se hace la t de Student en muestras independientes y en muestras con media, desviación estándar y tamaño muestral conocidas.

El contraste de hipótesis de una t de Student es el que sigue:

Contraste de hipótesis de una t de Student

  • H0: ambos grupos presentan medias iguales y no tienen diferencias significativas.
  • H1: ambos grupos presentan medias diferentes y tienen diferencias significativas.

Sin embargo, antes de comenzar y lanzarnos al fango de realizar una t de Student, es necesario que nuestros datos cumplan unos requisitos.

Requisitos para realizar una t de Student para comparar dos muestras apareadas en R

Para realizar una t de student para comparar dos muestras apareadas en R es necesario que ambas muestras se distribuyan siguiendo una distribución normal y sus varianzas sean iguales.

Test de normalidad Shapiro-Wilk

Para constrastar la normalidad, vamos a usar el test de Shapiro-Wilk. Los resultados para ambas variables son:

> shapiro.test(EXAMPLE$Before)

Shapiro-Wilk normality test

data: EXAMPLE$Before
W = 0.98143, p-value = 0.3219


> shapiro.test(EXAMPLE$After)

Shapiro-Wilk normality test

data: EXAMPLE$After
W = 0.97805, p-value = 0.2039

Como podemos observar, el p-valor de ambas variables (0.3219 y 0.2039) se sitúa por encima de 0.05. Esto significa que aceptamos la hipótesis nula y consideramos que ambas se distribuyen siguiendo una distribución normal.

Test de homocedasticidad F de Fisher

Para contrastar la homocedasticidad (o igualdad de varianzas), usamos el test F de Fisher. El resultado es el siguiente:

> var.test(MEDIDA ~ FACTOR, alternative='two.sided', conf.level=.95, data=EXAMPLE)

F test to compare two variances

data: MEDIDA by FACTOR
F = 1.3183, num df = 31, denom df = 31, p-value = 0.4461
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.6435104 2.7006123
sample estimates:
ratio of variances
1.318284

Como podemos observar, el p-valor (0.4461) es mayor que 0.05, aceptando la hipótesis nula de igualdad de varianzas.

t de Student para comparar dos muestras apareadas en R Commander

Perfecto. Una vez llegados a este punto es que nuestros datos son normales y homocedásticos. Para realizar una t de Student para comparar dos muestras apareadas en R Commander se hace siguiendo el siguiente esquema gráfico.

t de student para comparar dos muestras apareadas en r

 

  • Paso 1. Introducimos los datos. Fíjense en que hay dos columnas, una por cada variable (After y Before). A continuación vamos a Statistics – Means – Paired t-test…
  • Paso 2. En la ventana que despliega aparecen dos pestañas:
    • Data. En las dos cajas que aparecen, seleccionamos una variable en una (First variable (pick one)) y la otra variable en la otra (Second variable (pick one)).
    • Options. Como queremos hacer un contraste bilateral (Two-sided) y con un nivel de confianza del 95%, dejamos las opciones por defecto.
  • Paso 3. Vemos resultados que se despliegan en la sección de Output.
> t.test(EXAMPLE$After, EXAMPLE$Before, alternative='two.sided', conf.level=.95, 
+   paired=TRUE)

    Paired t-test

data:  EXAMPLE$After and EXAMPLE$Before
t = 2.527, df = 31, p-value = 0.01682
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 0.391834 3.670666
sample estimates:
mean of the differences 
                2.03125

Como se puede observar, el p-valor es 0.01682. Esto indica que al ser menor de 0.05 rechazamos la hipótesis nula y podemos decir que existen diferencias significativas entre ambas variables (Before y After).

Libros en Amazon sobre R Commander en español

1 thought on “t de Student para comparar dos muestras apareadas en R

Leave a Comment

*