Top Banner

of 54

Estadigrafos de Posicion y de Dispersion (1)

Oct 09, 2015

Download

Documents

David Gomez

l
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript

yoooo

ESTADIGRAFOS DE POSICION Y DISPERSIONLos captulos anteriores estn referidos, con cierto detalle, a la clasificacin de variables, recoleccin de datos, construccin de tablas de frecuencia y a la representacin grfica, como fase preliminar en la descripcin y anlisis estadstico. El objetivo principal de esta primera etapa, ha sido determinar la naturaleza y formas de la distribucin de frecuencias, como base para la reduccin de los datos a travs de ciertas caractersticas descriptivas y medidas de resumen.En el problema de comparar dos o ms distribuciones de frecuencias, puede resultar fcil hacer una comparacin grfica de las frecuencias, sin embargo, existen dificultades para hacer comparaciones cuantitativas. Estadsticamente para facilitar este anlisis comparativo es necesario disponer de algunos indicadores o medidas de resumen. An cuando la comparacin de los histogramas (o grficos) puede proporcionar valiosa informacin general, siempre es posible obtener informacin ms precisa y til, como la comparacin directa de los datos tabulados (tablas de frecuencia) y mucho mejor si se dispone de elementos o valores representativos (medidas de resumen) del conjunto de observaciones.Como respuesta, la Estadstica plantea reducir los datos y sustituir toda la tabla de frecuencias por unos pocos valores representativos del conjunto, es decir, reemplazar la distribucin de frecuencias por unas pocas caractersticas descriptivas de los aspectos fundamentales de la distribucin considerada.Estas caractersticas descriptivas (cantidad), constituyen los llamados ESTADGRAFOS, que son indicadores o medidas de resumen estadstico. Por tanto, en vez de comparar totalmente dos distribuciones de frecuencia o grficos, slo bastar comparar los estadgrafos de ambas distribuciones.

EstadgrafoEs la medida que en Estadstica se aplica sobre una muestra. En general se utilizan dos tipos: Estadgrafos de Posicin o de Tendencia Central y los Estadgrafos de Dispersin. Estadgrafos de Posicin o Medidas de PosicinTenemos:a. Las medidas denominadas promedios, sea aquellas que tratan de localizarse hacia el centro de la serie; MODA, MEDIA Y MEDIANA.

b. Los cuartiles y deciles, o cuartas y dcimas partes de las observaciones; esto slo se aplican en los datos agrupados.Estadgrafos de DispersinTenemos:a.El rango, la varianza, la desviacin estndar, el coeficiente de variacin, las medidas de forma; dentro de ellas estn el coeficiente de correlacin y la regresin lineal.

ESTADIGRAFOS DE POSICION O MEDIDAS DE TENDENCIA CENTRALLos Estadgrafos, son indicadores medidas de resumen estadstico. Describen la posicin que ocupa una distribucin de frecuencia alrededor de un valor de la variable. Los estadgrafos no son valores determinantes, ni menos valores exactos, pero si los mas representativos de una variable.Las medidas de tendencia central mas utilizadas son 3:MEDIANAMEDIA ARITMETICAMODA

MEDIANAEn el mbito de la estadstica, lamedianarepresenta el valor de la variable de posicin central en un conjunto de datos ordenados. De acuerdo con esta definicin el conjunto de datos menores o iguales que la mediana representarn el 50% de los datos, y los que sean mayores que la mediana representarn el otro 50% del total de datos de la muestra.En otras palabras es un indicador, dicho valor de la serie de datos se sita justamente en el centro de la muestra, luego de ordenarlos (un 50% de valores son inferiores y otro 50% son superiores).Para calcular la mediana debemos tener en cuenta:

Calculo de la mediana para datos no agrupados:Cuando el nmero de DATOS ES IMPAR:Si tenemos un nmero de datos impar, primero se debe ordenar los datos, luego ubicar la posicin central de los datos, este valor en la posicin central ser la mediana del conjunto de datos. Si N es impar, hay un termino central, el termino que ser el valor de la mediana.Me = (N + 1) /2Cuando el nmero de DATOS ES PAR: Si tenemos un nmero de datos Par, primero se debe ordenar los datos, luego ubicar los dos nmeros en la posicin central de los datos, y enseguida realizar el promedio de ellos, el resultado ser la mediana del conjunto de datos. y

Ejemplos:1. Sean los datos: 6, 4, 5, 6, 3, 6, 4, 7, 6.Paso 1:Primero ordenamos los datos: 3, 4, 4, 5, 6, 6, 6, 6, 7. Paso 2:Tenemos 9 datos, entonces N = 9. Aplicamos la formula: Me = (N + 1) / 2 Me = (9 + 1) / 2 Me = 5El valor 5 indica la posicin que ocupa la mediana en los datos. Entonces la mediana correspondiente a estos datos ser igual a 6.

102. Sean los datos: 14, 47, 36, 19, 70, 32, 59.Paso 1:Primero ordenamos los datos: 14, 19, 32, 36, 47, 59, 70. Paso 2:Tenemos 7 datos, entonces N = 7. Aplicamos la formula: Me = (N + 1) / 2 Me = (7 + 1) / 2 Me = 4El valor 4 indica la posicin que ocupa la mediana en los datos. Entonces la mediana correspondiente a estos datos ser igual a 36.

3. Sean los datos: 6, 1, 4, 3, 9, 1, 2, 7, 3, 5.Paso 1:Primero ordenamos los datos: 1, 1, 2, 3, 3, 4, 5, 6, 7, 9. Paso 2:Tenemos 10 datos, entonces N = 10. Por tener 10 datos la mediana ser calculada como una media aritmtica de los dos datos centrales,en este caso se asume los valores 3 y 4.Aplicamos la formula: Me = (N + 1) / 2 Me = X Me = (10 + 1) / 2 Me = (3 + 4) / 2 Me = 5.5 Me = 3.5El valor 5.5 indica la posicin que ocupa la mediana en los datos. Entonces la mediana correspondiente a estos datos ser igual a 3.5.

4. Sean los datos: 60, 15, 48, 36, 90, 17, 24, 72, 38, 50, 23, 72.Paso 1:Primero ordenamos los datos: 15, 17, 22, 24, 36, 38, 48, 50, 60, 72, 72, 90. Paso 2:Tenemos 12 datos, entonces N = 12. Por tener 12 datos la mediana ser calculada como una media aritmtica de los dos nmeros centrales, en este caso se asume los valores 38 y 48.Aplicamos la formula: Me = (N + 1) / 2 Me = X Me = (12 + 1) / 2 Me = (38 + 48) / 2 Me = 6.5 Me = 43El valor 6.5 indica la posicin que ocupa la mediana en los datos. Entonces la mediana correspondiente a estos datos ser igual a 43.

Calculo de la mediana en distribuciones agrupadas:Si los datos son presentados en tablas de frecuencia, se pueden dar dos casos: calculo de la mediana para variables cuantitativas discretas y variables cuantitativas continuas. Veamos:PARA VARIABLES CUANTITATIVAS DISCRETAS:Caso1. Si la mitad de los datos (N/2), se encuentra entre dos frecuencias acumuladas, as: [ Li-1,Li ); hay que determinar el intervalo mediano, la forma de hacerlo ser, calculando el valor de la mitad de n y observar que intervalo tiene una frecuencia absoluta acumulada que cumpla N i-1 < N/2 < Ni.Despus de saberlo haremos el siguiente clculo: Me = Li-1 + ai

Siendo:[ Li-1,Li ) = intervalo que contiene a la frecuencia acumulada N/2 ai = amplitud de dicho intervalo

N/2 Ni 1n iEjemplos:Dados los siguientes datos, calcular el intervalo mediano (mediana):

Paso 1: Calculamos N/2 = 921/2 = 460.5. Este valor nos indica que la mediana (Me) estar en el intervalo [ 60 , 70 ).Paso 2: Calculamos la mediana aplicando la formula:

Me = Li-1 + ai = 60 + x 10 = 64.42

[ Li-1, Li )niNi[20 , 30)150150[40 , 50)200350[60 , 70)250600[80 , 90)230830[100 , 110)91921N = 921N/2 Ni 1n i460.5 350250MEDIA ARITMETICAEs un indicador, que representa al conjunto de datos. Es el valor medio ponderado de la serie de datos. Se pueden calcular diversos tipos de media, siendo las ms utilizadas:MEDIA PARA DATOS ORIGINALES O NO AGRUPADOS:a) Media aritmtica: es la ms utilizada, es la suma de los valores entre el nmero total de datos. La media aritmtica o simplemente media es el promedio aritmtico de las observaciones, es decir, el cociente entre la suma de todos los datos y el numero de ellos. Dados los n nmeros X1, X2, ..., Xn, la media aritmetica se define simplemente como: X = =

X1 + X2 + X3 + .....+ Xn-1 + Xn n n i = 1 n El smbolo (mu) es usado para la media aritmtica de una poblacin. Usamos X, con una barra horizontal sobre el smbolo para medias de una muestra. X Ejemplos: 1. Se tiene las calificaciones finales de 20 estudiantes de la asignatura de Psicologa de la personalidad, hallar la Media Aritmtica.

X =

X = = 13.1512, 18, 14, 15, 20, 11, 10, 08, 15, 17, 05, 20, 19, 14, 10, 17, 16, 17, 05, 0012+18+14+15+20+11+10+08+15+17+05+20+19+14+10+17+16+17+05+0020263202. Se tiene las edades de 50 estudiantes del tercer semestre de la Facultad de Psicologa de la Universidad Peruana los Andes. Calcular la media aritmtica.

X = 1076/50 = 21.52La media aritmtica en general no divide a la distribucin en dos partes iguales.MEDIA PARA DATOS EN TABLAS O AGRUPADOSa) Media aritmtica: se calcula multiplicando cada valor por el nmero de veces que se repite. La suma de todos estos productos se divide por el total de datos de la muestra. La media aritmtica de una variable se define como la suma ponderada de los valores de la variable por sus frecuencias relativas y lo denotaremos por X y se calcula mediante la expresin:

18, 18, 17, 17, 17, 20, 21, 17, 19, 23, 23, 35, 22, 21, 17, 16, 17, 20, 23, 26,17, 18, 25, 26, 19, 17, 18, 21, 21, 20, 26, 17, 18, 19, 23, 22, 19, 21, 18, 18,19, 21, 33, 29, 20, 19, 17, 28, 39, 41n i = 1 X = X . f i = = i = 1 n X i.niNXi representa el valor de la variable o en su caso la marca de clase.Propiedades: Si multriplicamos o dividimos todas las observaciones por un mismo numero, la media queda multiplicada o dividida por dicho numero.Si le sumamos a todas las observaciones un mismo numero, la media aumentara en dicha cantidad.Ademas de la media aritmetica existen otros conceptos de media como son: la media geometrica y la media armonica.

Ejemplo :De la siguiente tabla de distribucin de frecuencias calcular la media.

ICMCffrfrAF%FA%17 - 2119370.7400.740747422 - 262480.1600.900169027 - 312920.0400.94049432 - 363420.0400.98049837 - 413910.0201.0002100TOTAL501.000100%X = = = 21.2 (19x37) + (24x8) + (29x2) + (34x2) + (39x1)50501060CALCULO DE LA MEDIA ARITMETICA PONDERADASe denomina media (aritmtica) ponderada de un conjunto de nmeros al resultado de multiplicar cada uno de los nmeros por un valor particular para cada uno de ellos, llamado su peso, obteniendo a continuacin la suma de estos productos, y dividiendo el resultado de esta suma de productos entre la suma de los pesos mas la masa segn la caracterstica de cada numero inicial. Este peso depende de la importancia o significancia de cada uno de los valores. O dicho de otro modo es un promedio en el que cada valor de observacin se pondera con algn ndice de su importancia. Crdova (2003).Para una serie de datos X = {x1, x2, , xn}, a la que corresponde los pesos W = {w1, w2, , wn}, la media ponderada se calcula como: Xi . wi

n i = 1 wi n i = 1 x =Un ejemplo es la obtencin de la media ponderada de las notas de una oposicion en la que se asigna distinta importancia (peso) a cada una de las pruebas de que consta el examen)Ejemplo: Se tiene las notas obtenidas en las diferentes asignaturas que llevo un estudiante durante el semestre 2007 II con sus respectivos creditos, obtener la media ponderada correspondiente.

x =X1 . W1 + X2 . W2 + X13. W3 + ... + Xn. Wn W1 + W2 + W3 + ... + WnNAsignaturaN de crditos wPromedio final x1Elocucin y redaccin3152Administracin II3133Metodologa Cientfica3164Realidad Peruana3185Matemtica bsica4116Anlisis matemtico5107Contabilidad bsica315x =

(15x3) + (13x3) + (16x3) + (18x3) + (11x4) + (10x5) + (15x3)(24)x =

(325)(3+3+3+3+4+5+3) = 13.54

MODA (M0)Es el valor de la variable que mas veces se repite, es decir, aquella cuya frecuencia absoluta es mayor. No tiene porque ser nica. Y si no hay ningn valor que se repite se dice que es amodal.

Lamodaes el valor que se presenta con mayor frecuencia en una distribucin. Se representaMo. Es importante observar si la representacin grfica de los datos presenta un solo modo (unimodal), dos modos (bimodal) o ms de dos (multimodal).Por ejemplo, en el caso en que se analiza el desarrollo de una epidemia segn la fecha de aparicin de los primeros sntomas de los afectados y, en la representacin grfica se observa un solo modo, significa que todos los casos estuvieron expuestos a una fuente nica de infeccin. Si los modos fueran dos, las fuentes de infeccin tambin seran dos y en el caso de un grfico multimodal, la exposicin a la infeccin sera mltiple.

Ejemplo:1. Determine la moda de los datos que se muestran a continuacin, se refieren a la estatura de un grupo de jvenes: 1.60, 1.65, 1.70, 1.71, 1.70, 1.70, 1.70, 1.71, 1.70, 1.93, 1.87, 1.85 m.Solucin:

La tabla muestra la distribucin de frecuencias de los datos o el numero de veces que estos se repiten, la mayor frecuencia que es 5 corresponde a una estatura de 1.70 m, por lo que esta seria la MODA. Xmod = 1.70 m.EstaturaFrecuencia1.6011.6511.70 5*1.7121.8511.8711.9312. Determine la moda de los siguientes datos que se refieren a la edad de alumnos de primer semestre de la carrera profesional de Psicologa: 18, 17, 19, 21, 19, 18, 22, 22, 18, 18, 17, 19, 19, 19, 18, 20, 21, 20, 18, 19, 18, 19, 18, 19, 22, 35.Solucion:

En este caso se observa que las edades que mas frecuencia tienen son las de 18 y 19 aos, por lo que concluimos que existen dos modas por lo tanto es BIMODAL. Xmod1 = 18 aos, Xmod2 = 19 aos.

Edad de alumnos Frecuencia17218 8*19 8* 202212223351CUANTILESEste termino es usado en la Estadstica Descriptiva y se refiere a las medidas de posicin no central que nos permiten reconocer otros puntos caractersticos de la distribucin que no son centrales. Son medidas de localizacin similares a las anteriores. Se las denomina cuantiles (Q). Su funcin es informar del valor de la variable que ocupara la posicin (en tanto por cien) que nos interese respecto de todo el conjunto de variables.Podemos decir que los cuantiles son unas medidas de posicin que dividen a la distribucin en un cierto numero de partes de manera que en cada una de ellas hay el mismo numero de valores de la variable.Las ms importantes son:a. Cuartiles: Dividen a la distribucin en cuatro partes iguales (tres divisiones). C1, C2, C3, correspondientes a 25%, 50%, 75%.b. Deciles: Dividen a la distribucion en 10 partes iguales (nueve divisiones).D1, D2, D3, D4, , D10, correspondiente a 10%, 20%, 30%, 40%, , 90%.

c. Percentiles: Dividen a la distribucin en 100 partes iguales (99 divisiones). P1, P2, P3, P4, , P100, correspondientes a 1%, 2%, 3%, 4%, , 99%.Existe un valor en el cual coinciden los cuartiles, los deciles y percentiles, esto sucede cuando son iguales a la Mediana y as veremos:

Distinguiremos a los cuantiles entre distribuciones agrupadas y las que no lo estn:CUANTILES EN LAS DISTRIBUCIONES SIN AGRUPAR:Primero hallaremos el lugar que ocupa. Entonces tendremos que:Ni=1 < (%) . n < Ni Q = XiEn el supuesto que (%) . n = Ni Q =

Primero encontraremos el intervalo donde estar el cuartil:

2550104100==Xi + xi+12

Lugar:Ni=1 < (%) . n < Ni Intervalo [Li-1, Li), en este caso:Q = Li-1 + ai

Ejemplo de Distribuciones NO AGRUPADAS:

Calcular la mediana (Me); el primer y tercer cuartil (C1, C3); el 4 decil (D4) y el 90 percentil (P90).

(%) N Ni-1nixini 53107155203252n = 20Ni310151820 Solucin:Calculando la Mediana (Me):Aplicamos la formula Me = N / 2 = (20 ) / 2 = 10, esto significa que la mediana se ubica en la posicin 10, como es un valor de la frecuencia absoluta acumulada, realizaremos el calculo y este valor corresponde a,Me = (Xi + Xi+1) / 2 = (10+15)/ 2 = 12.5Calculando el Primer cuartil (C1):Lugar que ocupa en la distribucin (1/4) . 20 = 20/4 = 5, como Ni-1< (25%).n< Ni, es decir 3 < 5 < 10, esto implica que C1 = xi = 10Calculando el Tercer cuartil (C3):Lugar que ocupa en la distribucin (3/4) . 20 = 60/4 = 15, que coincide con un valor de la frecuencia absoluta acumulada, por tanto realizamos el calculo:C3 = (Xi + Xi-1) / 2 = (15 + 20) / 2 = 17.5 Calculando el cuarto decil (C4): Lugar que ocupa en la distribucin (4/10) . 20 = 80/10 = 8, como Ni-1< (%).n< Ni, es decir 3 < 8 < 10, esto implica que D4 = xi = 10

Nonagsimo percentil (P90): Lugar que ocupa en la distribucin (90/100) . 20 = 1800/100 = 18, que coincide con un valor de la frecuencia absoluta acumulada, por tanto realizamos el calculo:

P90 = = =CUANTILES EN LAS DISTRIBUCIONES AGRUPADAS:Ejemplo de Distribuciones AGRUPADAS: Hallar el primer cuartil, el cuartodecil y el 90 percentil de la siguiente distribucin:

Xi + xi-1 20 + 25 2 2522,5[Li-1, Li)niNi [ 0 , 100 )9090[ 100 , 200 )140230[ 200 , 300 )150380[ 300 , 800 )120500n = 20 Solucin:

Calculando el Primer cuartil (C4):Lugar que ocupa el intervalo del primer cuartil: (1/4) . 500 = 500/4 = 125, por lo tanto C4 estar situado en el intervalo [ 100 , 200 ), aplicando la expresin directamente tendremos:C4 = 100 + 100 = 125 Calculando el cuarto decil (D4):Lugar que ocupa en la distribucin (4/10) . 500 = 2000/10 = 200, por tanto D4 estar situado en el intervalo [100 200). Aplicando la expresin tendremos:

D4 = 100 + 100 = 178, 57

125 - 90140200 - 90140Calculando el Nonagsimo Percentil (P90):Lugar que ocupa el intervalo: (90/100) . 500 = 45000/100 = 450, por lo tanto P90 estar situado en el intervalo [ 300 , 800 ), aplicando la expresin directamente tendremos:C4 = 300 + 100 = 358.33

450 - 380120Estadgrafos de Dispersin o Medidas de DispersinLas medidas de tendencia central nos proporcionan informacin sobre el comportamiento de un conjunto de observaciones a travs de un dato que tiende a ubicarse en un punto central, pero no nos proporciona informacin sobre las variaciones o dispersiones que pueden tener los datos en su conjunto, es decir sobre la homogeneidad o heterogeneidad de los datos.Para poder determinar esta variacin en un grupo de datos respecto a una variable determinada. Se recurre a medidas de desviacin o variacin cuyo objetivo principal es Medir el grado de dispersin o concentracin de los valores o datos, alrededor de las medidas de tendencia central.AMPLITUD O RANGO PARA DATOS NO AGRUPADOS Y DATOS AGRUPADOSRango viene a ser la diferencia entre el dato mayor y el dato menor :R = Xmx Xmin Donde :Xmx = dato mximo ; Xmin = dato mnimoRANGO INTERCUARTILICOEnestadstica descriptiva, se le llamarango intercuartlicoorango intercuartil, a la diferencia entre el tercer y el primercuartil de una distribucin. Es unamedida de dispersin estadstica.A diferencia delrango, se trata de unestadstico robusto.El rango intercuartlico es una medida de variabilidad adecuada cuando la medida de posicin central empleada ha sido lamediana. Se define como la diferencia entre el tercer cuartil (Q3) y el primer cuartil (Q1), es decir: RQ = Q3- Q1. A la mitad del rango intercuartil se le conoce como desviacin cuartil (DQ): DQ = RQ/2= (Q3- Q1)/2.Se usa para construir losdiagramas de caja y bigote (box plots) que sirven para visualizar la variabilidad de una variable y comparardistribuciones de la misma variable; adems de ubicar valores extremos.

PARA DATOS NO AGRUPADOSEjemplo:1. Tenemos los siguientes datos originales, las edades de los alumnos del 4 semestre del curso de Psicologa a distancia : 20, 49, 59, 18, 32, 32, 63, 24, 20, 32, 53, 48Calculamos el primer cuartil (Q1):Q1 = (1/4).n = 1/4.12= 3Calculamos el tercer cuartil (Q3):Q3 = (3/4).n = 3/4.12= 9Ordenamos los datos:18, 20, 20, 24, 32, 32, 32, 48, 49, 53, 59, 63

Interpretacin:A partir de los 22 aos hasta los 51 se ubica el 50 % de la distribucin.Calculamos el rango intercuartilico:RQ = Q3- Q 1 = 51 22 = 2929 aos es la distancia existente en el 50% central de la distribucin.

Q1 = 20+24/2Q1 = 22Q3 = 49+53/2Q3 = 51PARA DATOS AGRUPADOSEjemplo:1.Tenemos los datos de distribucin de pases segn porcentaje de la poblacin de 15 y ms aos de edad analfabtica.

Calculamos el primer cuartil (Q1):Q1 = Li-1 + . ai

[Li-1, Li)MCfifrfAF%ai0 - 52,51450145055 - 107,58282278510 201531125891020 - 42313112810022n = total28().N Fi-1fiQ1 = 0 + . 5 = 2.5

Q3 = 5 + . 5 = 9.4

RQ = 9,42,5 = 6,9

(1/4.28) 0148(3/4.28) 14

VARIANZA PARA DATOS NO AGRUPADOSLa varianza representa la media aritmtica de las desviaciones de la media elevadas al cuadrado. Si atendemos a la coleccin completa de datos (la poblacin en su totalidad) obtenemos la varianza poblacional; y si por el contrario prestamos atencin solo a una muestra de la poblacin, obtenemos en su lugar la varianza muestral. Las expresiones de estas medidas son las que aparecen a continuacin.Expresin de la varianza muestral:

S = = - X

Expresin de la varianza poblacional := = -

2xni = 1( Xi X ) 2n-1 Xi2n-122Ni = 1( Xi ) 2N Xi2N2Ejemplo: La siguiente muestra representa las edades de 25 personas sometidas a un anlisis de preferencias para un estudio de mercado.

Determinar la Varianza.Solucin:Paso 1: Calculamos la media aritmticaX = 25+19+21+35+44+20+27+ + 27/ 25 = 694/25 = 27.76

25192135442027323833183019293326242839313118173027Paso 2: Calculamos la varianza.

Aplicando la formula: S2 = 1217.57/25-1 = 50.73

EdadesXi - X(Xi - X)21717- 27.76 = 10.76115.7781818- 27.76 = 9.7695.2581818- 27.76 = 9.7695.2581919- 27.76 = 8.7676.7381919- 27.76 = 8.7676.7382020- 27.76 =7.7660.2182121- 27.76 = 6.7645.6982424- 27.76 = 3.7614.1382525- 27.76 = 2.767.6182626- 27.76 = 1.763.0982727- 27.76 = 0.760.5782727- 27.76 = 0.760.5782828- 27.76 = 0.240.0582929- 27.76 = 1.241.5383030- 27.76 = 2.245.0183030- 27.76 = 2.245.0183131- 27.76 = 3.2410.4983131- 27.76 = 3.2410.4983232- 27.76 = 4.2417.9783333- 27.76 = 5.2427.4583333- 27.76 = 5.2427.4583535- 27.76 = 7.2452.4183838- 27.76 = 10.24104.8583939- 27.76 = 11.24126.3384444- 27.76 = 16.24236.738xi = 694 (xi x)2 = 1217.57X = 694/25 = 27.76VARIANZA PARA DATOS AGRUPADOSPara calcular la varianza de una tabla de frecuencias, es necesario utilizar la siguiente frmula:

Donde:

Ejemplo: Calcular la varianzade la distribucin de la tabla:

DESVIACION ESTANDAR O DESVIACION TIPICA DE DATOS NO AGRUPADOSLa desviacin estndar es una medida del grado de dispersin de los datos del valor promedio. Dicho de otra manera, la desviacin estndar es simplemente el promedio o variacin esperada con respecto de la media aritmtica.Una desviacin estndar grande indica que los puntos estn lejos de la media y una desviacin pequea indica que los datos estn agrupados cerca de la media.Expresin de la Desviacin Estndar muestral: =

S2 (xi x)2ni = 1n - 1Expresin de la Desviacin Estndar poblacional: =

2 (xi )2ni = 1NEjemplo:1. Calcular ladesviacin estndarde la distribucin:9, 3, 8, 8, 9, 8, 9, 18Paso1: Calculamos la media aritmtica.

Paso2: Calculamos la desviacin estndar.

DESVIACION ESTANDAR O DESVIACION TIPICA DE DATOS AGRUPADOSExpresin de la Desviacin Estndar:

Ejemplo:1. Calcular la desviacin tpicade la distribucin de la tabla:

xifixi fixi2 fi[10, 20)15115225[20, 30)2582005000[30,40)351035012 250[40, 50)45940518 225[50, 60)55844024 200[60,70)65426016 900[70, 80)75215011 250421 82088 050

COEFICIENTE DE VARIACION PARA DATOS NO AGRUPADOSEl coeficiente de variacin o dispersin es til para comparar dispersiones a escalas distintas pues es una medida invariante ante cambios de escala . Por otro lado presenta problemas ya que a diferencia de la desviacin tpica este coeficiente es variable ante cambios de origen . Por ellos es importante que todos los valores sean positivos y su media es por tanto un valor positivoExigimos que: X > 0Se calcula: CV = Donde S es la desviacin tpica. Se puede dar en tanto por ciento.Calculando: CV = . 100

SXSXCOEFICIENTE DE VARIACION PARA DATOS AGRUPADOSSe calcula:

Ejemplo:1. Matas, un estudiante universitario, tiene las siguientes calificaciones en las 10 asignaturas que recibe en su carrera: 8, 7, 10, 9, 8, 7, 8, 10, 9 y 10. Josu, un compaero de Matas, tiene las siguientes calificaciones: 8, 9, 8, 7, 8, 9, 10, 7, 8 y 10. Cul estudiante tiene menor variabilidad en sus calificaciones?

a) Se agrupa las calificaciones y se realiza elclculo dela media aritmtica.

b) Se calcula la desviacin estndar.

c) Se calcula el coeficiente de variacin.Para Matas se obtiene:

Para Josu se obtiene: