La prueba t de Student es uno de los test más utilizados en estadística para utilizada para comparar las observaciones de 2 grupos. Realizar una t de Student para comparar dos muestras apareadas en R es extraordinariamente sencillo a partir del uso de la interfaz gráfica R Commander.
Pero antes de comenzar a explicar cómo se hace, vamos a definir qué son las muestras apareadas. Dos medidas están apareadas cuando se mide una variable en dos ocasiones como resultado de haber aplicado algún cambio. Pongamos un ejemplo para verlo más claro. Supongamos que estamos dando un tratamiento para favorecer el crecimiento de pelo. Tenemos unos individuos y antes de darles el tratamiento les medimos la densidad de pelos por centímetro cuadrado. Después les aplicamos el tratamiento y volvemos a medir esa variable sobre esos mismos individuos. Es decir, la variable densidad de pelos por centímetro cuadrado se mide dos veces en cada individuo. Están relacionadas o apareadas porque se miden sobre el mismo ejemplar.
En estos enlaces podréis conocer cómo se hace la t de Student en muestras independientes y en muestras con media, desviación estándar y tamaño muestral conocidas.
Quiero leer...
Por qué se llama t de Student y su relación con la cerveza Guinness
A todos los que nos gusta la Estadística hemos escuchado en algún momento hablar de la t de Student, ¿verdad? ¿Pero nos hemos preguntado alguna vez por qué se llama t de Student a este … Leer más…
El contraste de hipótesis de una t de Student es el que sigue:
Contraste de hipótesis de una t de Student
- H0: ambos grupos presentan medias iguales y no tienen diferencias significativas.
- H1: ambos grupos presentan medias diferentes y tienen diferencias significativas.
Sin embargo, antes de comenzar y lanzarnos al fango de realizar una t de Student, es necesario que nuestros datos cumplan unos requisitos.
Requisitos para realizar una t de Student para comparar dos muestras apareadas en R
Para realizar una t de student para comparar dos muestras apareadas en R es necesario que ambas muestras se distribuyan siguiendo una distribución normal y sus varianzas sean iguales.
Test de normalidad Shapiro-Wilk
Para constrastar la normalidad, vamos a usar el test de Shapiro-Wilk. Los resultados para ambas variables son:
[sourcecode lang=»r»] > shapiro.test(EXAMPLE$Before)Shapiro-Wilk normality test
data: EXAMPLE$Before
W = 0.98143, p-value = 0.3219
> shapiro.test(EXAMPLE$After)
Shapiro-Wilk normality test
data: EXAMPLE$After
W = 0.97805, p-value = 0.2039
[/sourcecode]
Como podemos observar, el p-valor de ambas variables (0.3219 y 0.2039) se sitúa por encima de 0.05. Esto significa que aceptamos la hipótesis nula y consideramos que ambas se distribuyen siguiendo una distribución normal.
Test de homocedasticidad F de Fisher
Para contrastar la homocedasticidad (o igualdad de varianzas), usamos el test F de Fisher. El resultado es el siguiente:
[sourcecode lang=»r»] > var.test(MEDIDA ~ FACTOR, alternative=’two.sided’, conf.level=.95, data=EXAMPLE)F test to compare two variances
data: MEDIDA by FACTOR
F = 1.3183, num df = 31, denom df = 31, p-value = 0.4461
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.6435104 2.7006123
sample estimates:
ratio of variances
1.318284
[/sourcecode]
Como podemos observar, el p-valor (0.4461) es mayor que 0.05, aceptando la hipótesis nula de igualdad de varianzas.
t de Student para comparar dos muestras apareadas en R Commander
Perfecto. Una vez llegados a este punto es que nuestros datos son normales y homocedásticos. Para realizar una t de Student para comparar dos muestras apareadas en R Commander se hace siguiendo el siguiente esquema gráfico.
- Paso 1. Introducimos los datos. Fíjense en que hay dos columnas, una por cada variable (After y Before). A continuación vamos a Statistics – Means – Paired t-test…
- Paso 2. En la ventana que despliega aparecen dos pestañas:
- Data. En las dos cajas que aparecen, seleccionamos una variable en una (First variable (pick one)) y la otra variable en la otra (Second variable (pick one)).
- Options. Como queremos hacer un contraste bilateral (Two-sided) y con un nivel de confianza del 95%, dejamos las opciones por defecto.
- Paso 3. Vemos resultados que se despliegan en la sección de Output.
+   paired=TRUE)
    Paired t-test
data:  EXAMPLE$After and EXAMPLE$Before
t = 2.527, df = 31, p-value = 0.01682
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 0.391834 3.670666
sample estimates:
mean of the differences
                2.03125
[/sourcecode]
Como se puede observar, el p-valor es 0.01682. Esto indica que al ser menor de 0.05 rechazamos la hipótesis nula y podemos decir que existen diferencias significativas entre ambas variables (Before y After).
¿tendrán los pasos para realizar un t2 de hotelling en r commander?