Análisis estadísticos multivariantes en R Commander

Los análisis estadísticos multivariantes se caracterizan porque de un conjunto de individuos de la muestra (n) se miden un número determinado de variables (p), dando por tanto una matriz de datos representada por los individuos y las variables medidas sobre ellos.

Matriz datos multivarianteExisten una gran cantidad de análisis estadísticos multivariantes, que pueden clasificarse según su finalidad (exploratorio o confirmatorio) o según la existencia de grupos control al inicio (supervisado o no supervisado). Haciendo click sobre los análisis, veremos cómo se realizan usando R Commander.

Análisis exploratorio y confirmatorio

  1. Análisis exploratorio de los datos (= Data mining): su objetivo es descubrir posibles patrones de comportamiento de los datos, entre los que se encuentran simetrías, modelos probabilísticos, grupos de datos homogéneos, etc. Tienen un papel fundamental los gráficos y no usan suposiciones ajenas a los datos.
  2. Análisis confirmatorio de los datos: se usan los contrastes de hipótesis para confirmar o refutar las hipótesis propuestas. Es decir, se obtiene un p-valor (en los análisis exploratorios no se obtienen p-valores ya que se deja que los datos hablen por ellos mismos, principalmente en modo gráfico. Una suposición que es habitualmente necesaria asumir es que las variables siguen una distribución normal multivariante. Este hecho no es imprescindible en sus homólogos robustos.

Análisis supervisados y no supervisados

  1. Estadística no supervisada: cuando no usamos información previa de otros sujetos para descubrir estructuras o grupos sobre los que asignar nuestros sujetos.
  2. Estadística supervisada

¡Viva el Software Libre!

Referencias

  • García Pérez, A., 2005. Métodos avanzados de estadística aplicada. Técnicas avanzadas, 1st ed. Universidad Nacional de Educación a Distancia, Madrid.