Análisis estadísticos multivariantes en R Commander

Los análisis estadísticos multivariantes en R se caracterizan porque de un conjunto de individuos de la muestra (n) se miden un número determinado de variables (p), dando por tanto una matriz de datos representada por los individuos y las variables medidas sobre ellos.

Matriz datos multivariante en Análisis estadísticos multivariantes en R Commander

Análisis estadísticos multivariantes en R

Existen una gran cantidad de análisis estadísticos multivariantes en R que pueden clasificarse según su finalidad (exploratorio o confirmatorio) o según la existencia de grupos control al inicio (supervisado o no supervisado). Por fortuna, la interfaz gráfica de R, R Commander, tiene implementados muchos de ellos en los menús, por lo que no es necesario aprender explícitamente su programación.

Análisis exploratorio y confirmatorio

  1. Análisis exploratorio de los datos (= Data mining): su objetivo es descubrir posibles patrones de comportamiento de los datos, entre los que se encuentran simetrías, modelos probabilísticos, grupos de datos homogéneos, etc. Tienen un papel fundamental los gráficos y no usan suposiciones ajenas a los datos.
  2. Análisis confirmatorio de los datos: se usan los contrastes de hipótesis para confirmar o refutar las hipótesis propuestas. Es decir, se obtiene un p-valor (en los análisis exploratorios no se obtienen p-valores ya que se deja que los datos hablen por ellos mismos, principalmente en modo gráfico. Una suposición que es habitualmente necesaria asumir es que las variables siguen una distribución normal multivariante. Este hecho no es imprescindible en sus homólogos robustos.

Análisis supervisados y no supervisados

  1. Estadística no supervisada: cuando no usamos información previa de otros sujetos para descubrir estructuras o grupos sobre los que asignar nuestros sujetos.
  2. Estadística supervisada

Referencias