Computación paralela en R usando caret
Es de sobra conocido que el tiempo es oro. No es lo mismo que un análisis en R tarde una hora que un día. Aquí os vamos a mostrar cómo se realizan los análisis a … Leer más…
R es un lenguaje de programación extraordinariamente versátil. Además, está específicamente desarrollado para realizar análisis estadísticos. La unión de lenguaje de programación y Estadística lo han convertido en uno de los principales métodos de análisis escogidos a nivel científico.
La Estadística es una de las disciplinas más demandadas hoy en día. Entre ellas, el análisis de datos y la visualización de los datos están a la cabeza. R te permite realizar cualquier análisis estadístico imaginable, así como crear elegantes figuras para resumir la dispersión de tus datos.
El análisis de datos es fundamental hoy en día, ya que la estadística lo inunda todo. R es el mejor software estadístico desarrollado en la actualidad, con miles de paquetes que aumentan su funcionalidad y potencialidad hasta el infinito. Absolutamente todos los análisis de datos pueden ser realizados con los códigos de R.
Si además de los análisis estadísticos le sumamos su condición de lenguaje de programación, los resultados son espectaculares. Podemos programar nuestros propios scripts, reproducir los análisis una y otra vez, etc. En definitiva, personalizar hasta lo deseable lo más mínimo. Ahí está su enorme potencial.
Primero, porque es Software Libre. Y segundo porque, como científico que soy, me dedico a analizar datos continuamente en mi labor investigadora.
Y R me proporciona prácticamente la totalidad de los recursos que necesito. Aprendo continuamente y para mí R es una fuente de inspiración.
La Ciencia evoluciona porque se publican los métodos de análisis al detalle. De ahí que los científicos puedan reproducir experimentos anteriores. Como software libre que es, tiene toda la información de lo que hace. De este modo no oculta nada, como en la Ciencia.
Por lo tanto, Ciencia y R se retroalimentan para crear un mundo más crítico y útil para los humanos que lo habitamos.
Existen interfaces gráficas que hacen más fácil la interacción del usuario con este lenguaje de programación. Algunas de estas interfaces son Rcmdr, Rstudio o Rkward.
Este lenguaje de programación estadístico, agrupado bajo el nombre de R Project, está publicado con licencia libre GPL (General Public License). Esto es, R es software libre, y gratuito. Esto permite un desarrollo a un ritmo muy superior a sus competidores, lo que se ha convertido en unos de los software estadísticos más conocidos, utilizados y modificados, del mundo.
Es de sobra conocido que el tiempo es oro. No es lo mismo que un análisis en R tarde una hora que un día. Aquí os vamos a mostrar cómo se realizan los análisis a … Leer más…
Cuando estamos haciendo nuestro proyecto en RStudio, podemos estar interesados en que nuestro trabajo sea conocido por toda la comunidad. Uno de los recursos más importantes para este fin es publicar nuestro código en GitHub. … Leer más…
Cuando estamos escribiendo un documento en R Markdown, aparte de emplear la sintaxis propia de Markdown podemos también incluir código ejecutable de otros lenguajes, como R, en lo que se llama chunks. Esto sin duda … Leer más…
Cuando estamos escribiendo una función en R tenemos que definir los argumentos que contiene. Si esos argumentos son cuantitativos o numéricos, a no ser que estén restringidos por una condición, pueden tomar cualquier valor. Pero … Leer más…
Una práctica correcta cuando escribimos funciones es dar información sobre posibles fallos. Estos fallos o alarmas tienen que ser informativos para que podamos saber por qué suceden. Si ejecutas una función y no sabéis por … Leer más…
Cuando conectamos MongoDB a R, podemos importar archivos JSON en nuestro entorno de trabajo en R. Sin embargo, en algunas ocasiones estos datos con estructura JSON no se interpretan como tal en R. En su … Leer más…
Tenemos un conjunto de datos que representa un vector con veinte valores. Estos valores contienen una fecha y una hora. Sin embargo, cuando los tenemos en R no tienen el formato de fecha y ahora. … Leer más…
Si tenemos unos datos y los cargamos en R, podemos recibir la fantástica sorpresa de ver que algunos campos parecen ser ilegibles. Algunos de estos datos pueden provenir de archivos JSON o de MongoDB a … Leer más…
MongoDB es un gestor fabuloso de base de datos no relacionales (NoSQL). Pero para realizar análisis estadísticos potentes se queda corto. Y aquí es, precisamente, donde R se hace grande. Por lo tanto, un buen … Leer más…
Seleccionar un número de filas de un tabla es relativamente sencillo en R. Pero si queremos seleccionar aleatoriamente un número de elementos concreto teniendo en consideración los factores de una variable categórica, ya es otro … Leer más…
Si tenemos una lista que contiene varios data frames, podemos tomar una muestra de un número determinado de filas de un modo iterativo. Pero antes de comenzar, generemos una lista con varios data frames siguiendo … Leer más…