Un software de análisis estadístico
INDICE
Introducción Como bajar R Manuales de R Librerías Inicio de Sesión en R Como bajar librerías GUI’s Rcomander
SciViewsR
Un poco de Historia
R es una implementación open-source del lenguaje S (Bell Labs -principios de los 90), que también es la base del sistema S-Plus (entorno comercial).
R y S-Plus aún comparten una gran mayoría de código e instrucciones, pero probablemente serán dos entornos independientes en un futuro a medio plazo.
Las funciones de R se agrupan en paquetes (packages, libraries), los que contienen las funciones más habituales se incluyen por defecto en la distribución de R, y el resto se encuentran disponibles en la Comprehensive R Archive Network (CRAN) http://cran.r-project.org
El entorno R
Suite integrada para la manipulación de datos, cálculo y procedimientos gráficos.
Los principales aspectos que ofrece son: Facilidad para el manejo y el almacenamiento de
datos. Un conjunto de operadores para cálculo con arrays
y matrices. Una colección extensa e integrada de herramientas
intermedias para el análisis de datos. Multitud de facilidades gráficas. Un lenguaje de programación simple y efectivo que
incluye las estructuras de control clásicas, funciones recursivas y facilidades para el input y output de datos y resultados.
El entorno R
R es un entorno altamente dinámico, y a menudo se concibe como un vehículo para desarrollar (nuevos) métodos interactivos de análisis de datos
Ventaja: incorporación constante de nuevos métodos.
Inconveniente: por su dinamismo, a menudo código antiguo de R se queda desfasado y no funciona con las nuevas versiones del entorno.
Como bajar R Acceder a la pagina del proyecto R (http://www.r-project.org) Pinchar en CRAN (Comprehensive R Archive Network )
Como bajar R
Pinchar en el Mirror de Spain (Spanish National Research Network, Madrid )
http://cran.es.r-project.org/
El sistema de librerías
Una librería o paquete es un conjunto de funciones sobre una temática común. El sistema R-base trae las librerías diseñadas por el núcleo central de desarrolladores (core). Sin embargo, el modelo descentralizado de producción de R conlleva que muchas funciones interesantes no se instalen con el paquete básico sino que estén contenidas en paquetes o librerías externas que hay que instalar por separado. Aunque son descargables desde muchos sitios de internet, se recomienda su descarga desde el repositorio Comprehensive R Archive Network (CRAN) porque se garantiza que su funcionamiento ha sido revisado y aprobado por el núcleo de desarrolladores.
Inicio de Sesión
Tras arrancar el programa, aparece una ventana titulada R Console que indica la versión de R y cómo obtener información de la licencia de uso.
Ventana de ordenes
Archivo Operaciones básicas con los ficheros.
Editar Típico menú con opciones de edición (copiar, pegar, ...).
Misc Opciones avanzadas. Paquetes Permite gestionar los paquetes
adicionales de R. Ayuda Información abundante sobre R.
Como bajar Librerías
Paquetes Instalar paquetes a partir de archivos zip locales Se busca el directorio desde se guarda el archivo Abrir
Como cargar Librerías
o Una vez instalada la librería hay que cargarla.
o Paquetes Cargar paquete (s)
Notas:
Cada 3 meses aparece una nueva versión de R Reinstalarlo cada 6 meses
Hay librerías que funcionan a partir de una determinada versión de R
Ayuda R
? mean help.search("mean") Busca en los
paquetes donde aparece la palabra mean
apropos("mean") Funciones donde aparece la palabra mean
GUI's
El hecho que R no tenga los menús para seleccionar funciones como tienen algunos otros sistemas de análisis estadístico puede hacer que resulte complejo su uso al principio.
Se han desarrollado varios GUI (Graphical User Interface) que ayudan al principio a irse familiarizandose con el lenguaje, aún a costa de perder flexibilidad
GUI's
Algunos de ellos son los siguientes:
Rcomander: Se instala a través de la librería Rcmdr
SciViewsR: Disponible desde el 2 de abril de 2005 . Esta interfaz grafica de R se asemeja a la que utiliza el programa SAS que divide la ventana en 3 secciones
Una para edición de sintaxis Una para visualizar resultados Una tercera para navegar por los objetos y
funciones).
SciViewsR
Requiere los siguientes pasos previos:
El programa R instalado y funcionando, el Rgui debe estar en modo sdi (Edit/Gui preferences/sdi, y salvar) hay que cerrar y volver a abrir el programa para que se apliquen los cambios.
Descargar e instalar sciViews-R_0.7-3Setup.exe , aceptando los iconos en el escritorio y en el menu de inicio.
Una vez instalado tenemos que entrar en la carpeta donde se ha instalado SciViews y modificar las propiedades del acceso directo a sciViews-R (boton derecho del mouse/propiedades/ en donde dice destino debe quedar reflejado el camino a Rgui.exe y las opciones que se describen abajo así:
"C:\Archivos de programa\R\rw2010pat\bin\Rgui.exe" --sdi RSciViews.RData
http://www.sciviews.org/SciViews-R/index.html
Librería Rcmdr
Ejecutar R En el menú Paquetes, pinchar en
Seleccionar espejo CRAN. En el cuadro de dialogo, escoger
Austria y pulsar en Aceptar En el menú Paquetes, pinchar en
Instalar paquetes Escoger Rcmdr y aceptar
Librería Rcmdr
En el menú Paquetes, pinchar en Cargar paquetes y seleccionar Rcmdr
También poniendo en la línea de comandos library(Rcmdr)
R Commander
Barra de Menús, con desplegables
Datos activos, Modelo Activo, Visualizar datos, Editar datos
Contiene aquellas salidas de las órdenes ejecutadas quese muestran en formato de texto.
Muestran las órdenes de R correspondientes a las opciones de los menús escogidas por el usuario. Además, tales instrucciones se pueden modificar, y ejecutar mediante el botón Ejecutar.
Barra de menús
Fichero: Hay opciones para cargar o grabar instrucciones, resultados o el entorno de trabajo.
Editar: Típico menú de edición. Permite seleccionar, cortar, copiar, pegar y buscar.
Datos: Permite la gestión de los datos por analizar. R mantiene distintos conjuntos de datos dentro del entorno de trabajo.
Estadísticas Recoge los diferentes métodos de análisis que se pueden aplicar al conjunto de datos activo.
Modelos Un conjunto de datos puede tener asociados varios modelos estadísticos. Este menú sirve para la gestión de los mismos.
Distribuciones Para trabajar con funciones de distribución de probabilidad: cuantiles, probabilidades y gráficas asociadas a las distribuciones normal, t, Chi^2, F, binomial. . .
Ficheros .R
Es simplemente un fichero de texto que contiene órdenes. Es posible escribir órdenes directamente en la ventana.
Sin embargo, es más sencillo permitir que el programa le ayude a construir un guión aprovechando que la realización de una acción desde un cuadro de diálogo añade la orden a la ventana de guiones.
En ésta puede ser modificada para su posterior ejecución. Para ello, ha de seleccionar con el ratón la orden u órdenes y después ha de pinchar el botón derecho del ratón en Ejecutar.
Ventana de instrucciones
En el cuadro de diálogo de un procedimiento determinado, pulse en el botón Ayuda para saber qué opciones del lenguaje R están disponibles (si hay alguna) para ese procedimiento.
Si desea información completa sobre el lenguaje de órdenes, consulte el manual de referencia incluido con la documentación de R.
Ventana de resultados Una vez que se solicita un análisis con los datos, los resultados
obtenidos se muestran en la ventana inferior. El texto en rojo son las órdenes correspondientes que aparecen
en la ventana de instrucciones. El texto en azul es el resultado de cada orden. Los contenidos de la ventana de resultados son texto puro, que
puede ser copiado a cualquier editor de texto para su procesamiento.
Ventana de resultados
Podemos usar las ventanas de instrucciones y resultados a manera de calculadora. El lenguaje R permite las operaciones aritméticas básicas, la definición de variables y funciones y dispone de una colección muy extensa de funciones ya definidas. En el siguiente, definimos la función varianza:
muestra <- c(1,3,5,7,33)
mean(muestra)
varianza <- function(x) {mean(x^2) - mean(x)^2}
varianza (muestra)
Manejo de datos
Aprenderemos a manejar los conjuntos de datos y a leer y almacenar en un fichero los datos necesarios para realizar un análisis. Estas tareas se realizan a través del menú Datos.
Nuevos datos Para introducir nuevos datos por el teclado.
Importar datos Para leer datos contenidos en un fichero.
Datos en paquetes R contiene una colección de datos de ejemplo.
Datos activos Aquí se gestiona el conjunto de datos activo.
Modificar variables de los datos activos Para realizar trasformaciones en los datos.
Manejo de datos
Si pinchas en Datos Puedes seleccionar los datos que te interesen
UN pasa a ser la base de datos activa
Manejo de datosBarra de elementos activo
Datos Nombre del conjunto de datos activo, es decir,el que se toma por omisión a la hora de ejecutar una orden.
Editar datos Hace aparecer una cuadrícula donde es posible modificar el contenido del conjunto actual de datos.
Visualizar datos Muestra el contenido del conjunto actual de datos.
Modelo Para un mismo conjunto de datos se pueden crear diferentes modelos de análisis (de regresión lineal, de componentes principales...). Este menú permite escoger el modelo activo, es decir, aquel considerado por omisión cuando se ejecuta una orden.
Manejo de datos
Para introducir los datos simplemente se coloca el cursor en la celda correspondiente a cada individuo y variable. Para moverse de una celda a otra se puede utilizar el ratón, o las teclas del cursor y retorno para el desplazamiento vertical, o las teclas del cursor y tabulador para el desplazamiento horizontal.
Al introducir los datos, se observa que R da por omisión nombre a las variables (var1, var2, ...)y define sus características. En principio, una variable puede ser numérica (numeric) o de caracteres (character). Si se desea cambiar el nombre o definir el tipo de variable hay que pulsar en la cabecera de la columna correspondiente.
Llamaremos factores a las variables de caracteres. Nos servirán para representar variables cualitativas, es decir, aquéllas cuyo valores toman un número finito de modalidades.
Manejo de datos
Observamos que no tenemos nombre de variable porque se lo hemos indicado así, ya que el fichero no disponía. Y que solo tiene una variable
Manejo de datos
Hombres <- read.table("C:/Documents and Settings/pina/Escritorio/R/Castellano/TA1_1.prn", header=FALSE, sep=",", na.strings="NA", dec=".", strip.white=TRUE)
Hombres$PR <- with(Hombres, substr(V1,1,2)) Hombres$COM <- with(Hombres, substr(V1,3,4)) Hombres$MUNI <- with(Hombres, substr(V1,5,7)) Hombres$DT <- with(Hombres, substr(V1,8,9)) Hombres$SEC <- with(Hombres, substr(V1,10,12))
Hombres$P00_04 <- with(Hombres, substr(V1,13,20)) Hombres$P05_09 <- with(Hombres, substr(V1,21,28)) Hombres$P10_14 <- with(Hombres, substr(V1,29,36)) Hombres$P15_19 <- with(Hombres, substr(V1,37,44)) Hombres$P20_24 <- with(Hombres, substr(V1,45,52)) Hombres$P25_29 <- with(Hombres, substr(V1,53,60)) Hombres$P30_34 <- with(Hombres, substr(V1,61,68)) Hombres$P35_39 <- with(Hombres, substr(V1,69,76)) Hombres$P40_44 <- with(Hombres, substr(V1,77,84)) Hombres$P45_49 <- with(Hombres, substr(V1,85,92)) Hombres$P50_54 <- with(Hombres, substr(V1,93,100)) Hombres$P55_59 <- with(Hombres, substr(V1,101,108)) Hombres$P60_64 <- with(Hombres, substr(V1,109,116)) Hombres$P65_69 <- with(Hombres, substr(V1,117,124)) Hombres$P70_74 <- with(Hombres, substr(V1,125,132)) Hombres$P75_79 <- with(Hombres, substr(V1,133,140)) Hombres$P80_84 <- with(Hombres, substr(V1,141,148)) Hombres$P85mas <- with(Hombres, substr(V1,149,156))
Manejo de datosRecodificar variable Crea una nueva variable a partir de una ya xistente. Sirve para agrupar datos cuantitativos en intervalos.
Manejo de datosSegmentar variable numérica Simplifica la agrupación de datos cuantitativos en intervalos, aunque por ello es menos flexible que Recode variable.
Análisis descriptivo
Las medidas mediante comandos
Meanmean(Basededatos$NombreVariable)
Mediana: median(Basededatos$NombreVariable)
Media recortada:mean(Basededatos$NombreVariable, trim=0.05)
Amplitud:
diff(range(Basededatos$NombreVariable))
Recorrido intercuartílico:
IQR(Basededatos$NombreVariable)
Coeficiente de variación:
CV<-sd(Basededatos$NombreVariable) / mean (Basededatos$NombreVariable)
Análisis descriptivo
Simetría:
skewness(Basededatos$NombreVariable)
Curtosis:
kurtosis(Basededatos$NombreVariable)
Informes con la librería svViews
Cargamos la librería svViews
view(x, type = "argumento")x=objeto
type= type=“ summary” type=“ print”type=“ twowars”type=“ missing”type=“ sascode”