Distribución normal y cálculo de probabilidades en R Commander

La Distribución Normal, también conocida como Distribución de Gauss o Distribucción Gaussiana, es un tipo de distribución de datos procedentes de una variable continua. Se caracteriza porque su función de densidad tiene forma de campana (campana de Gauss) y es simétrica respecto de un determinado parámetro estadístico (por ejemplo, la media muestral). Se puede contrastar si una variable presenta distribución normal o no haciendo un test de Shapiro-Wilk o un test Lilliefors. Dependiendo de los test que se utilicen

Programa para hacer gráficos estadísticos: R Commander

R Commander es una interfaz gráfica de R que hace muy sencillo la interacción entre el usuario y el lenguaje R. En particular, para realizar cálculos de probabilidades, sus menús facilitan la tarea enormemente. En concreto, el cálculo de las probabilidades de una distribución normal se hace en R Commander siguiendo la siguiente ruta:

Distributions → Continuous distributions → Normal distribution

Probabilidades de una distribución normal

En el menú que se despliega después de pinchar sobre Normal distribution (distribución normal), nos aparece un menú desplegable con 4 opciones. De esas cuatro opciones de la distribución normal, desarrollaremos 3 de ellas, dejando para otro post la generación de muestras aleatorias que sigan la distribución normal o cualquier otra.

  1. Gráfica de la distribución normal (1) (Plot normal distribution…): permite obtener la función de densidad (density function) como la función de distribución (distribution function).
  2. Probabilidades normales (2) (Normal probabilities…): permite calcular las probabilidades de una distribución normal a partir de un valor preestablecido en el eje de abscisas, tanto si es en la cola derecha o izquierda de la campana de Gauss.
  3. Cuantiles normales (3) (Normal quantiles…): permite calcular en una distribución normal a partir de qué valor en el eje de abscisas tenemos unas probabilidades preestablecidas, tanto si es en la cola derecha o izquierda de la campana de Gauss.
Gráficos de la distribución normal Punto 1
Probabilidades normales Punto 2
Cuantiles normales Punto 3
Muestra de una distribución normal

Distribución normal y cálculo de probabilidades en R Commander con ejemplos

Ejemplos de cálculo de probabilidad de una distribución normal

Tengamos, por ejemplo, una muestra que presenta distribución normal con media = 1 y desviación estándar = 2. La solución a las siguientes preguntas se encuentran en la imagen superior. Fueron resueltas usando la GUI R Commander.

¿Cuál es la probabilidad de obtener aleatoriamente un dato de la muestra que sea menor de 0?

La respuesta es un 30.85%. Esto es, de cada 100 datos que extraigamos al azar, 30.85 datos serán menores que 0.

¿Para qué valor de los datos de la muestra tendremos una probabilidad del 30.85% a la izquierda de la distribución?

La respuesta es -2.19e-7, es decir, 0. Por lo tanto, a partir del valor 0 en el eje x y hacia la izquierda de la distribución, tendremos el 30.85% de los datos.

Vemos por tanto que las probabilidades y los cuantiles son complementarios. Mientras que uno te da la probabilidad de coger al azar un individuo que tenga menos de 0 en la variable en cuestión, el otro te dice para qué valor de la variable hay un 30.85% de probabilidad en la cola izquierda.

Esto, obviamente, lo podemos aplicar para cualquier variable y cualquier valor. Os animo a que probéis con vuestros datos y hagáis unos cálculos rápidos.

Libros de referencia en Amazon

Estos son los libros que he utilizado como referencia para escribir esta entrada.

[easyazon_image align=”none” height=”500″ identifier=”8436258614″ locale=”ES” src=”http://vivaelsoftwarelibre.com/wp-content/uploads/2016/11/41PdkNnD6L.jpg” tag=”losojosdeante-21″ width=”354″][easyazon_image align=”none” height=”500″ identifier=”8436255631″ locale=”ES” src=”http://vivaelsoftwarelibre.com/wp-content/uploads/2016/11/51WeiF2BgIYL.jpg” tag=”losojosdeante-21″ width=”358″]

6 comentarios en “Distribución normal y cálculo de probabilidades en R Commander

  1. Hola necesito tu ayuda porfavor! estoy usando el Rcmdr y tengo una duda que ningun blog me pudo sacar. Tengo que calcular los valores de tcrit y f criticos para unos datos que me dieron que siguen distribución normal. Una vez que voy al R y tomo variables contínuas –> t –> en probabilidades acumuladas NO SE QUE PONER EN VALORES DE LA VARIABLE! agradezco tu ayudaaaa!

  2. Hola, para empezar decirte que muy buen artículo.
    Tengo una duda. Comentas como calcular, por ejemplo la probabilidad normal (1|2) de que el dato de la muestra sea menor que 0. Como se puede escribir, por ejemplo, que sea menor que 1 y mayor que 0 ?
    Muchas gracias.

    • Hola Emilio,
      Pues muy sencillo, teniendo en cuenta que estamos trabajando con áreas (el área debajo de la curva = 1). Hay varias formas.
      1. Calculas la probabilidad de que sea mayor que 1 y calculas la probabilidad de que sea menor que 0. Sumas ambas probabilidades y luego restas 1 – la suma de ambas probabilidades.
      2. Calculas la probabilidad de que sea menor que 1 y calculas la probabilidad de que sea mayor que 0. Restas ambas probabilidades y tienes el mismo valor que en la opción 1.
      3. Puedes jugar con otras opciones.
      Espero habértelo aclarado.

Deja un comentario

*