Top Banner
2-2008 1 Organización de datos numéricos Estadística Capítulo 2.2
52

Estadistica 2 2

Apr 12, 2017

Download

Education

Sergio Malkind
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Estadistica 2 2

2-2008 1

Organización de datos numéricos

EstadísticaCapítulo 2.2

Page 2: Estadistica 2 2

2-2008 2

ARREGLO ORDENADO

Una vez que los datos de la encuesta se encuentran listos, el siguiente paso es organizar la información y ordenarla.

• Por cada variable se hace un ordenamiento simple.

• El determinar cual es el dato que tiene menor valor y cual el de mayor valor es información vital para empezar a trabajar con variables cuantitativas.

Page 3: Estadistica 2 2

2-2008 3

Suponga que decide llevar a cabo un estudio del costo de una comida en un restaurante de una gran ciudad. A 50 restaurantes citadinos se les consultó sobre el precio promedio de sus platos y se obtuvieron los siguientes resultados.

Page 4: Estadistica 2 2

2-2008 4

Precio del plato en 50 restaurantes citadinos50 38 43 56 51 36 25 33 41 4434 39 49 37 40 50 50 35 22 4544 38 14 44 51 27 44 39 50 3531 34 48 48 30 42 26 35 32 6336 38 53 23 39 45 37 31 39 53

Page 5: Estadistica 2 2

2-2008 5

Precio de plato en 50 restaurantes de la ciudad14 22 23 25 26 27 30 31 31 3233 34 34 35 35 35 36 36 37 3738 38 38 39 39 39 39 40 41 4243 44 44 44 44 45 45 48 48 4950 50 50 50 51 51 53 53 56 63

Page 6: Estadistica 2 2

2-2008 6

Rango

Calcular el rango es determinar la longitud numérica que existe entre el primer dato y el último.

• Restar el dato menor del dato mayor de la muestra y se obtiene el rango.

• Rango = DatoMayor - DatoMenor

Page 7: Estadistica 2 2

2-2008 7

La pregunta que estamos analizando ya tiene sus datos ordenados, ahora determinar a simple vista cuales son los datos mayor y menor respectivamente:

Dato Mayor $ 63.00Dato Menor $ 14.00

Page 8: Estadistica 2 2

2-2008 8

RANGO

En una muestra o población el rango es la distancia entre el dato mayor y el dato menor. Se calcula restando ambos datos.

MenorDatoMayorDatoRango

Page 9: Estadistica 2 2

2-2008 9

Cálculo del rango.

Muestra de restaurantes citadinos

491463

RangoRango

DatoMenorDatoMayorRango

Page 10: Estadistica 2 2

2-2008 10

DISTRIBUCIÓN DE FRECUENCIAS

Sin importar si los datos están o no ordenados, siempre es posible crear una distribución de frecuencias para los datos de una variable en una muestra.

La distribución de frecuencias es una tabla de resumen en la que los datos están organizados en clases o grupos numéricamente ordenados.

Page 11: Estadistica 2 2

2-2008 11

DISTRIBUCIÓN DE FRECUENCIAS

Se organiza en filas y columnas para resumir la información y poder realizar interpretaciones de manera rápida y efectiva.

Seleccionar el número apropiado de agrupaciones o clases para la tala,

determinando una amplitud conveniente de las clases y estableciendo los límites

de cada una para evitar traslape.

Page 12: Estadistica 2 2

2-2008 12

Amplitud de intervalo o clase

La Amplitud de cada intervalo o clase se calcula dividiendo el rango entre el número de intervalos elegidos.

Se ha convenido que todos los intervalos tengan la misma amplitud.

elegidosIntervalosdeNumeroRangoAmplitud

Page 13: Estadistica 2 2

2-2008 13

Amplitud de un Intervalo o clase

La mayoría de las veces la amplitud de un intervalo es mejor trabajarla con una anchura que sea un número entero (aplican restricciones).Si el resultado de la división es decimal, se redondea el resultado de la siguiente manera.

• Si el resulta es menor de 0.5 se elimina la parte decimal.

• En caso contrario se pasa al próximo entero.

Page 14: Estadistica 2 2

2-2008 14

Cálculo de la amplitud

Muestra de restaurantes citadinos

77/49

749

1463

AmplitudAmplitudIntervalosRangoRango

DatoMenorDatoMayorRango

Page 15: Estadistica 2 2

2-2008 15

DISTRIBUCIÓN DE FRECUENCIAS

Se organiza en filas y 2 columnas:Columna 1: El nombre de la variable que se está analizando.

Columna 2: Las veces que se repiten los datos con las mismas características de la variable y se le llama frecuencia.

Variable Frecuencia

   

   

   

   

   

   

Page 16: Estadistica 2 2

2-2008 16

DISTRIBUCIÓN DE FRECUENCIAS

Cuando la variable es numérica, se trata de valores y si éstos son más de 10 datos diferentes, es conveniente hacer grupos para administrarlos con eficiencia. A cada grupo de datos se le llama Intervalo o clase.

Intervalos Frecuencia

   

   

   

   

   

   

Page 17: Estadistica 2 2

2-2008 17

DISTRIBUCIÓN DE FRECUENCIAS

Un intervalo es como un rango, tiene un dato mayor y un dato menor y el estilo de representación puede ser de varias maneras; la más generalizada es:

Intervalos Frecuencia

   

   

   

   

   

   

DatoMenor pero menos que DatoMayor o

Page 18: Estadistica 2 2

2-2008 18

DISTRIBUCIÓN DE FRECUENCIAS

La información en cada intervalo debe ser única.

Para determinar el número de intervalos para una distribución, se calcula con la información del valor del Rango.

Intervalos Frecuencia

   

   

   

   

   

   

Page 19: Estadistica 2 2

2-2008 19

DISTRIBUCIÓN DE FRECUENCIAS

Se sugiere que una distribución de frecuencias no debe tener menos de 5 intervalos, ni más de 15.Si no se sigue esta convención, la interpretación de los datos puede ser demasiado condensada o muy dispersa y en ambos casos los resultados aunque están bien, no son objetivos. Y puede afectar la toma de decisiones.

IntervalosFrecuen

ciaIntervalo 1 Frec. 1Intervalo 2 Frec. 2Intervalo 3 Frec. 3Intervalo 4 Frec. 4Intervalo 5 Frec. 5Intervalo 6 Frec. 6

Page 20: Estadistica 2 2

2-2008 20

DISTRIBUCIÓN DE FRECUENCIAS

Los datos por ser numéricos, pueden ir de 100 a 1000, o se pueden extender a 10,000, etc. Un intervalo es similar al rango, el cual tiene un dato mayor y un dato menor, solo que la distancia entre ellos recibe el nombre de Amplitud

Intervalos FrecuenciaIntervalo 1 Frec. 1Intervalo 2 Frec. 2Intervalo 3 Frec. 3Intervalo 4 Frec. 4Intervalo 5 Frec. 5Intervalo 6 Frec. 6

Page 21: Estadistica 2 2

2-2008 21

DISTRIBUCIÓN DE FRECUENCIAS

Determinar el número de intervalos que sirva a una muestra se basa en la experiencia o sentido común de la persona que va a generar la distribución de frecuencias.

Intervalos FrecuenciaIntervalo 1 Frec. 1Intervalo 2 Frec. 2Intervalo 3 Frec. 3Intervalo 4 Frec. 4Intervalo 5 Frec. 5Intervalo 6 Frec. 6

Page 22: Estadistica 2 2

2-2008 22

Calcular el rango. Elegir el número de intervalos Calcular la anchura de cada intervalo Generar los intervalos de clases (no

deben menos de 5 ni más de 15) Determinar la frecuencia para cada

intervalo.

Procedimiento para generar una distribución de frecuencias

Page 23: Estadistica 2 2

2-2008 23

Calcular las frecuencias de la distribución para los 50 restaurantes citadinos

Precio de plato14 22 23 25 26 27 30 31 31 3233 34 34 35 35 35 36 36 37 3738 38 38 39 39 39 39 40 41 4243 44 44 44 44 45 45 48 48 4950 50 50 50 51 51 53 53 56 63

Page 24: Estadistica 2 2

2-2008 24

78.6534534

337337

Amplitud

IntervalosRangoRangoDatoMenorDatoMayor

Page 25: Estadistica 2 2

2-2008 25

En este caso, se iniciará el primer intervalo con el dato menor de la muestra = 14

A 14 se le suma la amplitud que es 7 y es = 21

El primer intervalo será el siguiente:

14 pero menos de 21

Page 26: Estadistica 2 2

2-2008 26

Para calcular el segundo intervalo, se toma como dato menor el 21 y se le suma la amplitud que es 7 = 28.

El segundo intervalo resulta ser:De 21 a menos de 28

Para el tercer intervalo, se toma como dato menor el 28 y se le suma 7 = 35

El tercer intervalo será:De 28 a menos de 35

Page 27: Estadistica 2 2

2-2008 27

En el cuarto intervalo, el dato menor es 35, se suma la amplitud 7 = 42.

El cuarto intervalo resulta ser:De 35 a menos de 42

En el quinto intervalo, al dato menor 42 se le suma 7 = 49

El quinto intervalo es:De 42 a menos de 49

Page 28: Estadistica 2 2

2-2008 28

PRECIO DE PLATO Frecuencia14 pero menos de 21   

21 pero menos de 28  

28 pero menos de 35  

35 pero menos de 42  

42 pero menos de 49  

49 pero menos de 5656 pero menos de 6363 pero menos de 70

Intervalos o clases

Page 29: Estadistica 2 2

2-2008 29

Calcular la frecuencia de cada intervalo.

El primer intervalo de “14 pero menos de 21”, se cuenta el número de datos que tienen esa

característica y solo es 14. Al contar los números resulta que es 1 dato

El segundo intervalo de de “21 pero menos de 28” se cuenta 22, 23, 25, 26 y 27 que son 5

Page 30: Estadistica 2 2

2-2008 30

PRECIO POR PLATO Frecuencia14 pero menos de 21  121 pero menos de 28 528 pero menos de 3535 pero menos de 42  42 pero menos de 4949 pero menos de 5656 pero menos de 6363 pero menos de 70

Page 31: Estadistica 2 2

2-2008 31

El tercer intervalo de “28 pero menos de 35”, se cuenta 30, 31, 31, 32, 33, 34, 34 (35 no); la frecuencia es 7.

El cuarto intervalo de “35 pero menos de 42” se cuentan 35, 35, 35, 36, 36, 37, 37, 38, 38, 38, 39, 39, 39, 39, 40, 41 y resultan 16

Page 32: Estadistica 2 2

2-2008 32

PRECIO POR PLATO Frecuencia14 pero menos de 21  121 pero menos de 28 528 pero menos de 35 7 35 pero menos de 42 16 42 pero menos de 4949 pero menos de 5656 pero menos de 6363 pero menos de 70

Page 33: Estadistica 2 2

2-2008 33

El quinto intervalo de “42 pero menos de 49”, está formado por se cuenta con 42, 43, 44, 44, 44, 44, 45, 45, 48, 48 ; la frecuencia es 10.

El sexto intervalo de “49 pero menos de 56” se cuentan 49, 50, 50, 50, 50, 51, 51, 53, 53 y resultan 9

Page 34: Estadistica 2 2

2-2008 34

PRECIO POR PLATO Frecuencia14 pero menos de 21  121 pero menos de 28 528 pero menos de 35 7 35 pero menos de 42 16 42 pero menos de 49 1049 pero menos de 56 956 pero menos de 6363 pero menos de 70

Page 35: Estadistica 2 2

2-2008 35

El séptimo intervalo de “56 pero menos de 63”, está formado por se cuenta con 56 y la frecuencia es 1.

El sexto intervalo de “63 pero menos de 70” se cuentan 63 y resulta 1.

Page 36: Estadistica 2 2

2-2008 36

Los intervalos quedan de la siguiente manera:PRECIO POR PLATO Frecuencia14 pero menos de 21  121 pero menos de 28 528 pero menos de 35 7 35 pero menos de 42 16 42 pero menos de 49 1049 pero menos de 56 956 pero menos de 63 163 pero menos de 70 1

Page 37: Estadistica 2 2

2-2008 37

Fronteras de clase

Las fronteras de clase o límites de clase, son los extremos numéricos de una clase.

Un intervalo tiene la forma “a – b”, contiene los números que empiezan en “a” y que casi terminan de “b”

Page 38: Estadistica 2 2

2-2008 38

Intervalo 14 pero menos de 21

• La frontera inferior es 14• La frontera superior se acerca a 21Intervalo 21 pero menos de 28

• La frontera inferior es 21• La frontera superior se acerca a 28

Page 39: Estadistica 2 2

2-2008 39

Frontera real de clase Numéricamente, “antes de A” no es un

número. Se establece un límite de acuerdo a la

formulación de los datos. Si los datos se ministran con dos decimales,

se busca el número que está exactamente antes de la frontera superior.Intervalo normal Fronteras reales21 pero menos de 28 21 y 27.921 pero menos de 28 21 y 27.99

Page 40: Estadistica 2 2

2-2008 40

Intervalo o claseFrontera

inferiorFrontera

Superior

14 pero menos de 21  14 2121 pero menos de 28 21 2828 pero menos de 35 28 3535 pero menos de 42 35 4242 pero menos de 49 42 4949 pero menos de 56 49 56

Calcular las fronteras reales de la siguiente distribución:

Page 41: Estadistica 2 2

2-2008 41

Marca de Clase

Es el punto medio de un intervalo de clase, se calcula sumando sus fronteras y dividiendo el resultado entre dos. El intervalo es dividido a la mitad

Page 42: Estadistica 2 2

2-2008 42

Intervalo o clase Marca de clase

14 pero menos de 21  (14+21)/2 = 17.521 pero menos de 28 (21+28)/2 = 24.528 pero menos de 35 (28+35)/2 = 31.535 pero menos de 42 (35+42)/2 =38.542 pero menos de 49 (42+49)/2 = 45.549 pero menos de 56 (49+56)/2 = 52.5

Calcular las marcas de clase de la siguiente distribución:

Page 43: Estadistica 2 2

2-2008 43

Frecuencia Relativa

La frecuencia relativa es la proporción de frecuencia que corresponde un intervalo con relación al tamaño de la muestra.

Page 44: Estadistica 2 2

2-2008 44

Cálculo de la frecuencia relativa

Se suman todas las frecuencias Se divide la frecuencia de cada

intervalo entre el total de frecuencias. Todas las frecuencias son valores

entre 0.0 y 1.0 La suma de todas las frecuencias

relativas debe ser igual a uno (1)

Page 45: Estadistica 2 2

2-2008 45

Frecuencia Relativa

PRECIO POR PLATO FrecuenciaFrecuencia

Relativa14 pero menos de 21  1 1/50 = 0.0221 pero menos de 28 5 5/50 = 0.1028 pero menos de 35 7  7/50 = 0.1435 pero menos de 42 16  16/50 = 0.3242 pero menos de 49 10 10/50 = 0.2049 pero menos de 56 9 9/50 = 0.1856 pero menos de 63 1 1/50 = 0.0263 pero menos de 70 1 1/50 = 0.02

Page 46: Estadistica 2 2

2-2008 46

Frecuencia Acumulada

La frecuencia acumulada es la suma parcial para cada intervalo, permite hacer observaciones sobre los intervalos que están por debajo de él.

Page 47: Estadistica 2 2

2-2008 47

Cálculo de la frecuencia acumulada

Se suman todas las frecuencias Se suma la frecuencia del intervalo con

todas las frecuencias anteriores. La frecuencia acumulada de cada

intervalo nunca es menor que el valor del intervalo anterior.

El último intervalo debe tener como resultado la suma de todas las frecuencias (tamaño de la muestra)

Page 48: Estadistica 2 2

2-2008 48

PRECIO POR PLATO FrecuenciaFrecuencia Acumulada

14 pero menos de 21  1 121 pero menos de 28 5 628 pero menos de 35 7  1335 pero menos de 42 16  2942 pero menos de 49 10 3949 pero menos de 56 9 4856 pero menos de 63 1 4963 pero menos de 70 1 50

Frecuencia Acumulada

Page 49: Estadistica 2 2

2-2008 49

Frecuencia Porcentual

La frecuencia porcentual es la misma frecuencia relativa pero en formato de % (porcentaje). El total de la muestra siempre resulta ser 100%

Page 50: Estadistica 2 2

2-2008 50

Frecuencia Porcentual

La frecuencia porcentual se puede calcular para las frecuencias absolutas o las acumuladas

Page 51: Estadistica 2 2

2-2008 51

PRECIO POR PLATO FrecuenciaFrecuencia

Porcentual14 pero menos de 21  1 0.02*100 = 221 pero menos de 28 5 0.10 *100 = 1028 pero menos de 35 7  0.14*100 = 1435 pero menos de 42 16  0.32*100 = 3242 pero menos de 49 10 0.20*100 = 2049 pero menos de 56 9 0.18*100 = 1856 pero menos de 63 1 0.02*100 = 263 pero menos de 70 1 0.02*100 = 2

Page 52: Estadistica 2 2

2-2008 52

Fin del capítulo 2.2

Continúa el capítulo 2.3