Pr´ actica 1 Intro MATLAB Descrip. datos Rep. Gr´ afica Medidas de posici´ on Medidas de dispersi´ on Descrip. 2 variables Estad´ ıstica Descriptiva 1 con MATLAB/Octave Ingenier´ ıa de Telecomunicaciones Departamento de Estad´ ıstica Universidad Carlos III de Madrid Curso 2009/2010 1 Consultar ficheros Descriptiva 1 y Descriptiva 2 1 / 42
42
Embed
Estad stica Descriptiva MATLAB/Octave · Pr actica 1 Intro MATLAB Descrip. datos Rep. Gr a ca Medidas de posici on Medidas de dispersi on Descrip. 2 variables Estad stica Descriptiva1
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Practica 1
Intro MATLAB
Descrip. datos
Rep. Grafica
Medidas deposicion
Medidas dedispersion
Descrip. 2variables
Estadıstica Descriptiva1 conMATLAB/Octave
Ingenierıa de Telecomunicaciones
Departamento de Estadıstica
Universidad Carlos III de Madrid
Curso 2009/2010
1Consultar ficheros Descriptiva 1 y Descriptiva 21 / 42
Ejemplo: averıasPara trabajar con la tabla como una matriz, la guardamos con elnombre de tabla. De este modo podemos manejar sencillamente suselementos.
>> tabla = tabulate(averias)
Por ejemplo, podemos expresar las frecuencias relativas entre 0 y 1,en lugar de en %
Algunos graficos son diferentes en funcion de que las variablessean discretas o continuas.
Se utilizan con frec. absolutas o relativas y acumuladas.
Diagrama de barrasGrafico de tarta, de sectores o pictogramaHistograma
17 / 42
Practica 1
Intro MATLAB
Descrip. datos
Rep. Grafica
Medidas deposicion
Medidas dedispersion
Descrip. 2variables
Representacion graficaVariables cuantitativas
Ejemplo: averıas en centrales electricas
Diagrama de barras:
En MATLAB utilizamos el comando bar
>> bar(tabla(:,2))
obtenemos el diagr. de barras defrec. absolutas
1 2 3 4 50
2
4
6
8
10
12
14
18 / 42
Practica 1
Intro MATLAB
Descrip. datos
Rep. Grafica
Medidas deposicion
Medidas dedispersion
Descrip. 2variables
Representacion graficaVariables cuantitativas
Ejemplo: averıas en centrales electricas
Diagrama de tarta, sectores o pictograma:
En MATLAB utilizamos el comando pie
>> pie(tabla(:,2))
33%
33%
20%
13%
3%
19 / 42
Practica 1
Intro MATLAB
Descrip. datos
Rep. Grafica
Medidas deposicion
Medidas dedispersion
Descrip. 2variables
Representacion graficaVariables cuantitativas
Ejemplo: alturas de alumnos
Histograma:
La variable alturas, recoge los datos sobre la altura de 28 alumnosen una clase.
alturas = [ 156; 159; 153; 157; 162; 156; 162;
153; 158; 152; 153; 159; 154; 153;
150; 162; 163; 160; 162; 156; 164;
168; 152; 151; 159; 147; 165; 149 ]
Comando hist
>> hist(alturas)
145 150 155 160 165 1700
1
2
3
4
5
6
20 / 42
Practica 1
Intro MATLAB
Descrip. datos
Rep. Grafica
Medidas deposicion
Medidas dedispersion
Descrip. 2variables
Podemos seleccionar el numero de clases o intervalos que deseemos
>> hist(alturas, 5) % 5 clases o intervalos
145 150 155 160 165 1700
1
2
3
4
5
6
7
8
21 / 42
Practica 1
Intro MATLAB
Descrip. datos
Rep. Grafica
Medidas deposicion
Medidas dedispersion
Descrip. 2variables
Supongamos que en la clase se incorpora un nuevo alumno que mide2.10 metros
Creamos una nueva variable alturas2
>> alturas2 = [alturas; 210];>> hist(alturas2,5)
140 150 160 170 180 190 200 2100
1
2
3
4
5
6
7
8
9
10
El nuevo alumno es un dato atıpico22 / 42
Practica 1
Intro MATLAB
Descrip. datos
Rep. Grafica
Medidas deposicion
Medidas dedispersion
Descrip. 2variables
Diagrama para frec. acum.
Ejemplo: averıas centrales electricas
Nos centramos en las frecuencias absolutas y absolutas acumuladasDe la variable tabla representamos las columnas 2 y 4
>> bar([tabla(:,2) tabla(:,4)])
1 2 3 4 50
5
10
15
20
25
30
35
40
Frec. Abs
Frec. Abs Acum.
23 / 42
Practica 1
Intro MATLAB
Descrip. datos
Rep. Grafica
Medidas deposicion
Medidas dedispersion
Descrip. 2variables
Resumen
1 Introduccion entorno MATLAB/Octave
2 Descripcion de un conjunto de datos
3 Representacion grafica
4 Medidas de posicion
5 Medidas de dispersion
6 Descripcion conjunta de dos variables
24 / 42
Practica 1
Intro MATLAB
Descrip. datos
Rep. Grafica
Medidas deposicion
Medidas dedispersion
Descrip. 2variables
Medidas de posicionmedia, mediana
Ejemplo: alturas de alumnos
Volviendo al ejemplo anterior alturas2
La media x , comando mean:
>> mean(alturas2)ans =
156.9643
La mediana xmed , comando median:
>> median(alturas2)ans =
156.5000
25 / 42
Practica 1
Intro MATLAB
Descrip. datos
Rep. Grafica
Medidas deposicion
Medidas dedispersion
Descrip. 2variables
Resumen
1 Introduccion entorno MATLAB/Octave
2 Descripcion de un conjunto de datos
3 Representacion grafica
4 Medidas de posicion
5 Medidas de dispersion
6 Descripcion conjunta de dos variables
26 / 42
Practica 1
Intro MATLAB
Descrip. datos
Rep. Grafica
Medidas deposicion
Medidas dedispersion
Descrip. 2variables
Medidas de dispersionvarianza, desviacion tıpica y rango
Miden la “dispersion” de las observaciones dentro del conjunto dedatos respecto de alguna medida de posicion.
Varianza:
VARx = S2x =
1
n
n∑i
(xi − x)2
Desviacion tıpica:
DTx = Sx =√
S2x
Rango o amplitud:
Rangox = max(xi )− mın(xi )
27 / 42
Practica 1
Intro MATLAB
Descrip. datos
Rep. Grafica
Medidas deposicion
Medidas dedispersion
Descrip. 2variables
En MATLAB
Comando var
>> var(x)
Comando std
>> std(x)
Comando range
>> range(x)
O tambien con los comandos max y min, es decir:max(x)-min(x).
28 / 42
Practica 1
Intro MATLAB
Descrip. datos
Rep. Grafica
Medidas deposicion
Medidas dedispersion
Descrip. 2variables
Resumen
1 Introduccion entorno MATLAB/Octave
2 Descripcion de un conjunto de datos
3 Representacion grafica
4 Medidas de posicion
5 Medidas de dispersion
6 Descripcion conjunta de dos variables
29 / 42
Practica 1
Intro MATLAB
Descrip. datos
Rep. Grafica
Medidas deposicion
Medidas dedispersion
Descrip. 2variables
Ejemplo: longitud/pesoSe ha medido la longitud (X en mm) y el peso (Y en gr) de unamuestra de 117 tornillos producidos por una maquina, la informacionse representa en la siguiente tabla:
nij
X / Y 40-60 60-80 80-100 100-200
140-160 4 0 0 0160-180 14 60 2 0180-200 0 20 16 1
>> tornillos = [ 4 0 0 014 60 2 00 20 16 1 ]
30 / 42
Practica 1
Intro MATLAB
Descrip. datos
Rep. Grafica
Medidas deposicion
Medidas dedispersion
Descrip. 2variables
Ejemplo: longitud/pesoSe ha medido la longitud (X en mm) y el peso (Y en gr) de unamuestra de 117 tornillos producidos por una maquina, la informacionse representa en la siguiente tabla:
nij
X / Y 40-60 60-80 80-100 100-200
140-160 4 0 0 0160-180 14 60 2 0180-200 0 20 16 1
>> tornillos = [ 4 0 0 014 60 2 00 20 16 1 ]
31 / 42
Practica 1
Intro MATLAB
Descrip. datos
Rep. Grafica
Medidas deposicion
Medidas dedispersion
Descrip. 2variables
Podemos calcular la tabla de frecuencias relativas, simplemente
Con el comando crosstab, podemos trabajar con tablas dedoble entrada, por ejemplo, para las variables cualitativasmomento e ISP, podemos crear la matriz de tamano 3× 2. En laque las filas representan las tres categorıas de la variablemomento (1= manana, 2 = tarde y 3 = noche) y las columnaslos dos tipos de proveedores ISP
>> crosstab(momento,ISP)ans =
3 1011 2518 28
ISPMOMENTO 1 2
manana 3 10tarde 11 25noche 18 28
37 / 42
Practica 1
Intro MATLAB
Descrip. datos
Rep. Grafica
Medidas deposicion
Medidas dedispersion
Descrip. 2variables
Ejemplo: InternetHistograma por grupos
El fichero histg.m permite representar graficamente unhistograma por grupos.
Guardaremos el fichero en el directorio C:/practica1/
>> histg(MB,ISP)
155 160 165 170 175 180 185 190 195 2000
0.05
0.1
0.15
0.2
0.25
0.3
ISP 1ISP 2
38 / 42
Practica 1
Intro MATLAB
Descrip. datos
Rep. Grafica
Medidas deposicion
Medidas dedispersion
Descrip. 2variables
Ejemplo: InternetAnalisis por grupos
El comando grpstats permite calcular estadısticas por grupos.
GRPSTATS(X,GROUP) calcula la media de los grupos.
[MEANS,SEM,COUNTS,GNAME] = GRPSTATS(X,GROUP), calculalas medias (MEANS), desviaciones tıpicas (SEM), el numero deelementos en cada grupo (COUNTS), y el nombre de cada grupo(GNAME)
39 / 42
Practica 1
Intro MATLAB
Descrip. datos
Rep. Grafica
Medidas deposicion
Medidas dedispersion
Descrip. 2variables
Ejemplo: InternetAnalisis por grupos
>> [MEANS,SEM,COUNTS,GNAME]=grpstats(MB,ISP)
MEANS =
165.3125
179.3492
SEM =
0.7834
0.6345
COUNTS =
32
63
GNAME =
’1’
’2’
40 / 42
Practica 1
Intro MATLAB
Descrip. datos
Rep. Grafica
Medidas deposicion
Medidas dedispersion
Descrip. 2variables
Ejemplo: Internetgrafico de dispersion
Con la funcion plot, podemos representar un grafico dedispersion de dos variables cuantitativas, por ejemplo, para lasvariables MB y tiempo conexion:
>> plot(MB,tiempo_conexion)
155 160 165 170 175 180 185 190 1950
2
4
6
8
10
12
¿Existe una relacion lineal entre MB y tiempo conexion? ¿existedependencia lineal?
41 / 42
Practica 1
Intro MATLAB
Descrip. datos
Rep. Grafica
Medidas deposicion
Medidas dedispersion
Descrip. 2variables
Ejemplo: Internetcovarianza y correlacion
El comando cov, calcula la matriz de covarianzas
>> cov(MB,tiempo_conexion)ans =
67.6847 13.817213.8172 4.7746
COV (X , Y ) =
(S2
x Sx,y
Sx,y S2y
)
El comando corrcoef, calcula el coefficiente de correlacion.