Introducción A lo largo de su existencia el ser humano ha llevado a cabo análisis de una gran cantidad de datos o información, referentes a los problemas o actividades de sus comunidades. Por ejemplo, desde comienzos de la civilización se hacían representaciones gráficas y otros símbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el número de personas, animales o cosas. Hacia el año 3000 a. C., los babilonios usaban pequeñas tablillas de arcilla para recopilar datos sobre la producción agrícola y los géneros vendidos o cambiados mediante el trueque. Mucho antes de construir las pirámides, los egipcios analizaban los datos de la población y la renta del país. Otro ejemplo de recopilación y análisis de datos es el del imperio romano, cuyo primer gobierno, al verse en la necesidad de mantener control sobre sus esclavos y riquezas, recopiló datos sobre la población, superficie y renta de todos los territorios bajo su control. Siguiendo con la historia de la recopilación de datos, a mediados del primer milenio, por el gran crecimiento de las poblaciones y para poder tener control sobre éstas, se comenzaron a efectuar censos poblacionales, como los de la Edad Media en Europa. Por ejemplo, los reyes caloringios 1 Pipino el Breve y Carlomagno ordenaron hacer estudios minuciosos de las propiedades de la Iglesia en los años 758 y 762, respectivamente. Conforme pasaba el tiempo, la recopilación y análisis de datos comenzaban a tener otro fin además de los censos y conocimiento de diferentes propiedades. Por ejemplo, en Inglaterra a principios del siglo XVI se realizó el registro de nacimientos y defunciones, con el cual en 1662 apareció el primer estudio de datos poblacionales, titulado Observations on the London Bills of Mortality (“Comentarios sobre las partidas de defunción en Londres”). Un estudio similar sobre la tasa de mortalidad en la ciudad de Breslau, en Alemania, realizado en 1691, fue utilizado por el astrónomo inglés Edmund Halley como base para la primera tabla de mortalidad. En el siglo XIX, con la generalización del método científico para estudiar todos los fenómenos de las ciencias naturales y sociales, los investigadores aceptaron la necesidad de reducir la información a valores numéricos para evitar la ambigüedad de las descripciones verbales. 1.1 Estadística Como se explicó, el ser humano tuvo la necesidad de crear una ciencia que redujera la información a valores numéricos para la mejor interpretación de los fenómenos; se le llamó estadística. La estadística es una rama de las matemáticas aplicadas que proporciona métodos para reunir, organizar, analizar e interpretar información, y usarla para obtener diversas conclusiones que ayuden a tomar decisiones en la solución de problemas y en el diseño de experimentos. ¿Qué entendemos por estadística? Definición 1.1 1 Carolingia también llamada Carlovingia, fue una dinastía de reyes francos que gobernaron un vasto terri- torio de Europa Occidental desde el siglo VII hasta el siglo X d. C.; su nombre fue tomado de su más renombrado miembro, Carlomagno.
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Introducción
Alolargodesuexistenciaelserhumanohallevadoacaboanálisisdeunagrancantidaddedatosoinformación,referentesalosproblemasoactividadesdesuscomunidades.Porejemplo,desdecomienzosdelacivilizaciónsehacíanrepresentacionesgráficasyotrossímbolosenpieles,rocas,palosdemaderayparedesdecuevasparacontarelnúmerodepersonas,animalesocosas.Haciaelaño3000a.C.,losbabiloniosusabanpequeñastablillas de arcilla para recopilar datos sobre la producción agrícola y los génerosvendidosocambiadosmedianteeltrueque.Muchoantesdeconstruirlaspirámides,losegipciosanalizabanlosdatosdelapoblaciónylarentadelpaís.
Otroejemplode recopilaciónyanálisisdedatoseseldel imperio romano,cuyoprimergobierno,alverseenlanecesidaddemantenercontrolsobresusesclavosyriquezas,recopilódatossobrelapoblación,superficieyrentadetodoslosterritoriosbajosucontrol.
Siguiendo con la historia de la recopilación de datos, a mediados del primermilenio,porelgrancrecimientodelaspoblacionesyparapodertenercontrolsobreéstas,secomenzaronaefectuarcensospoblacionales,comolosdelaEdadMediaenEuropa.Porejemplo,losreyescaloringios1Pipinoel BreveyCarlomagnoordenaronhacerestudiosminuciosos de las propiedades de la Iglesia en los años 758 y 762, respectivamente.
Conformepasabaeltiempo,larecopilaciónyanálisisdedatoscomenzabanatenerotrofinademásdeloscensosyconocimientodediferentespropiedades.Porejemplo,enInglaterraaprincipiosdelsigloxviserealizóelregistrodenacimientosydefunciones,conelcualen1662aparecióelprimerestudiodedatospoblacionales,tituladoObservations on the London Bills of Mortality(“ComentariossobrelaspartidasdedefunciónenLondres”).Unestudiosimilarsobre latasademortalidadenlaciudaddeBreslau,enAlemania,realizadoen1691,fueutilizadoporelastrónomoinglésEdmundHalleycomobaseparalaprimeratablademortalidad.Enelsigloxix,conlageneralizacióndelmétodo científicoparaestudiartodoslosfenómenosdelascienciasnaturalesysociales,losinvestigadoresaceptaron la necesidad de reducir la información a valores numéricos para evitar laambigüedaddelasdescripcionesverbales.
1.1 Estadística
Comoseexplicó,elserhumanotuvolanecesidaddecrearunacienciaqueredujeralainformaciónavaloresnuméricospara lamejor interpretaciónde los fenómenos; se lellamóestadística.
La estadística es una rama de las matemáticas aplicadas que proporciona métodos para reunir, organizar, analizar e interpretar información, y usarla para obtener diversas conclusiones que ayuden a tomar decisiones en la solución de problemas y en el diseño de experimentos.
Actualmentelaestadísticaesunmétodoefectivoparadescribir con precisión losvaloresdedatoseconómicos,políticos,sociales,psicológicos,biológicosofísicos,yunaherramientapararelacionaryanalizardichosdatos.Porestarazón,laestadísticasedivideendiferentesramas, entre las más aplicadas y que analizaremos están la estadística descriptiva y lainferencial.
Lamateriaprimadelaestadísticasonlosconjuntosdenúmerosobtenidosalcontaromedirelementos.Portanto,alrecopilardatosestadísticossedebetenerespecialcuidadoparagarantizarquelainformaciónseacompletaycorrecta;deestemodo,elprimerpasoesdeterminarquéinformaciónyenquécantidadsehadereunir.Porejemplo,enuncensoes importanteobtenerelnúmerodehabitantesde formacompletayexacta;delamismamanera,cuandounfísicoquierecontarelnúmerodecolisionesporsegundoentrelasmoléculasdeungas,debeempezarpordeterminarconprecisiónlanaturalezade los objetos a contar. Dado que la naturaleza de los fenómenos en estudio es muyvariada,esnecesarioproporcionarunaseriededefinicionesreferentesalosconjuntosdedatosquesehandeestudiar.
La población es el conjunto que incluye el total de elementos o datos cuyo conocimiento es de interés particular.
Dado que la información disponible consta frecuentemente de una porción osubconjuntodelapoblación,introducimosunsegundoconcepto,eldemuestradeunapoblación.
La muestra es cualquier subconjunto de la población.
1. Sielconjuntodedatosde interésestáconstituidoportodos lospromediosdeungrupode estudiantes de licenciatura de una universidad, cada uno de los estudiantes seráun individuo estadístico, mientras que el conjunto de todos estos estudiantes serálapoblaciónyunamuestrapodríaserelconjuntodetodoslosestudiantesdeltercercuatrimestredeingeniería.
¿Cómo se obtiene un conjunto de datos en estadística?
Definición 1.2
Definición 1.3
Ejemplo 1
21Unidad 1 • Estadística dEscriptiva
3.Si se está estudiando el resultado de ciertos experimentos químicos, cada uno deesosexperimentosseráunindividuoestadísticoyelconjuntodetodoslosposiblesexperimentosenesascondicionesserálapoblación,mientrasqueunamuestrapodríaserunconjuntoderesultadosexperimentalesposiblesenciertascondiciones.
Cuando se definió el concepto población, se mencionaron sus elementos, tambiénllamadosindividuos;además,enelejemplo1seobservóqueéstospuedenserdescritosporunaovariasdesuspropiedadesocaracterísticas.
El caracter de un elemento, individuo u objeto es cualquier característica por medio de la cual se puede clasificar y estudiar.
1. Si los individuos son personas, el sexo, el estado civil, el número de hermanos o suestatura soncaracteres.2. Sielindividuoesunareacciónquímica,eltiempo de reacción,lacantidad de producto obtenidoosiésteesácidoobásico,soncaracteresquepuedenanalizarse.
Un caracter es cuantitativo si es posible medirlo numéricamente o cualitativo sinoadmitemedición.Porejemplo,elnúmerodehermanosylaestaturasoncaracterescuantitativos,mientrasqueelsexoyelestadocivilsoncaracterescualitativos.
Los distintos valores que puede tomar un caracter cuantitativo configuran unavariable estadística.Lasvariablesestadísticasseclasificanendiscretasycontinuas.
Una variable estadística es discreta sólo cuando permite valores aislados, como números enteros.
Porejemplo,lavariablenúmero de hermanostomalosvalores0,1,2,3,4y5.Estetipodevariablessecaracterizanporobtenersemedianteunproceso de conteo(versemejanzaconlasvariablesaleatoriasdiscretasenlaunidad5).
Una variable estadística es continua cuando admite todos los valores de un intervalo.
Por ejemplo, la variable estatura, en ciertapoblación estadística, toma cualquiervalorenelintervalo158-205cm.Otromáseslatemperatura deunapersona.Estetipo
Definición 1.4
Ejemplo 2
¿Qué es un caracter cuantitativo?
¿Qué es una variable estadística?
Definición 1.5
Definición 1.6
22 Estadística y probabilidad
de variables se caracteriza por obtenerse mediante mediciones (ver semejanzas con lasvariablesaleatoriascontinuasenlaunidad7).
Comoya sedijo, la estadística sedivideenvarias ramas,unadeellas es la estadística descriptiva.Despuésdehaberestudiadolosconceptosdepoblaciónymuestraesposibledefinirla.
La estadística descriptiva es la parte de la estadística que organiza, resume y analiza la totalidad de elementos de una población o muestra.
Sufinalidadesobtenerinformación,organizarla,resumirlayanalizarla,lonecesariopara que pueda ser interpretada fácil y rápidamente y, por tanto, pueda utilizarseeficazmente.
1. Seleccióndecaracteresfactiblesdeserestudiados.2. Mediante encuestaomedición,obtencióndel valorde cada elemento en los
caracteresseleccionados.3. Obtención de números que sintetizan los aspectos más relevantes de una
distribución estadística (más adelante a dichos números los llamaremosparámetrosparaelcasodelapoblaciónyestadísticosenlasmuestras).
4. Elaboracióndetablasdefrecuencias,mediantelaadecuadaclasificacióndelosindividuos dentro de cada carácter (esto lo estudiaremos más adelante en eltema“Clasesdefrecuencias”).
Porejemplo,lapoblaciónestudiantildeunauniversidadsepuededividirengruposformados por diferentes especialidades (ingeniería industrial, ingeniería en sistemas,administración,etc.)ydespuésdecadaunadeellasseprocedeaseleccionarunamuestraaleatoriaparallevaracabounaentrevistayobtenerlainformacióndeseada.
Ademásde losdos tiposdemuestreomencionados,existeelmuestreo sistemáticoy el muestreo por conglomerados. El problema de muestreo es más complejo de lo queparece;paraunestudiomásdetalladodeltema,elestudiantepuedeconsultarellibroElementos de muestreo,deRichardL.ScheafferyWilliamMendenhall,deGrupoEditorialIberoamérica.
Cuando una persona tiene en sus manos un conjunto de datos para analizarlos,generalmentecalcula,enprimerainstancia,unpromediodeéstos.Porejemplo,dichapersonatienelascantidadesmensualesquehaganadoenlosúltimosseismeses(10800,9700,11100,8950,9750y10500)ydeseaconocerelvalorquerepresentasusalariopromedio.Enestecaso,obtendrásuingresopromedioalsumarlascantidadesydividirentreelnúmerodemesesquetrabajó
Dado el conjunto finito de datos muestrales x1, x2,..., xn, la media muestral (promedio aritmético) o estadístico media del conjunto es el estadístico que representa el promedio de los datos simbolizado por x (x barra), y se calcula
Dado el conjunto de datos poblacionales x1, x2,. . ., xN, se llama media poblacional o parámetro media del conjunto al parámetro representado por (miu o mu), y se calcula
µ =+ + +
==∑x x x
N NxN
ii
N1 2
1
1
Un fabricante de pistones toma una muestra aleatoria de 20 de éstos, para medir sudiámetro interno promedio. Con la información que el fabricante obtuvo dada encentímetros,secalculasudiámetromedio
1. Cuando la cantidad de observaciones es impar, el valor medio delordenamiento eseldatoqueseencuentreenlaposición(n+1)/2.
2. Cuando la cantidad de datos es par, de tal manera que resultan dos datosmedios localizadosenlasposicionesn/2yn/2+1,lamedianaseconsideraelpromediodeéstos.
En la mediana se puede observar que el valor $25 000, el cual sobresalía conrespecto a todos losdemás, adiferenciade la media,no influye en el resultadode la mediana.Puestoquesienlugarde$25000seelige$5000o$100000,elsueldomediodelosdieztrabajadoresseguirásiendo$2350.Porlocualsedicequelamedianaesunamedida central insensibledelosdatos.
Enlasiguientelistasemuestranlascalificacionesde20exámenesde lingüística. Se calculadelingüística. Se calculaingüística.Secalculalacalificaciónquemásserepite,esdecir,lamodadeladistribucióndelascalificaciones.
Yasehananalizadolostresvalorescentralesmásconocidosyutilizadosenlaestadísticadescriptiva. El primero de ellos fue el definido en la sección 1.5.1 como una mediaaritmética,sinembargo,existendistribucionesdedatosparalascualesestamedidanoesmuypropicia,porloquesedefinenyutilizanotrotipodemedidascentrales,lamedianaylamoda.Acontinuaciónseveránotrostiposdepromediosquesondeutilidadenlaestadísticadescriptiva.
Paraloscasosenquecadadatotieneunaimportancia relativaensudistribución–lacualse denomina peso–, la media correspondiente más apropiada se obtiene sumando losproductosdecadadatoporsupeso,llamandoadichamedidamedia ponderada.
En un conjunto de datos x1, x2,. . ., xn se llama pesos o ponderaciones respectivas de estos datos a las cantidades w1, w2,. . ., wn que cumplen
a) wi ∈ [ ]0,1 , para todo valor de ib) w1 + w2 + . . . + wn = 1
Paraunanálisismáscompletodeladistribucióndelosdatos,elestudiodesusmedidascentrales no es suficiente, puesto que en diferentes conjuntos de datos puede habermedidas centrales iguales, por tanto, no se tendría conocimiento de la forma de sudistribución.
Por tanto, es necesario realizar un estudio de la distribución de los datos conrespectoasuvalorcentral,esdecir,senecesitaunvalorqueindiqueunamedidaparacompararlasdispersionesdedatosentrediferentesconjuntos;estasmedidassonvalores dedispersiónovariabilidaddelconjuntodedatos.
La varianza muestral o estadístico varianza del conjunto de datos x1, x2,. . ., xn, se representa por s2, y se define como el valor medio de los cuadrados de las desviaciones de cada uno de los datos con respecto a x , y se calcula
s2 21
1
= −=∑n
x xii
n( )
Sobre la definición anterior podemos decir que denota la intención de una medidavariacionaldeunconjuntodedatos,sóloquemásadelante(unidades9y10)severáqueesconvenientedefinirelestadísticovarianzadividiendoentren–1enlugarden.Paradistinguirlas,selesasignannombresdiferentes,loscualessejustificaránhastalaunidad9,cuandoseanaliceeltema“Estimadorespuntuales”.Mientrastantosedefine
La varianza sesgada como sn
x xn ii
n2 21
1
= −=∑ ( )
Definición 1.14
Definición 1.15
33Unidad 1 • Estadística dEscriptiva
La varianza insesgada como sn
x xn ii
n
−=
=−
−∑11
2 21
1( )
Pero, ¿por qué dos definiciones diferentes en lugar de una? Porque la varianzasesgada refleja perfectamente el significado de una medida de dispersión ypor consiguientetieneunagranaplicaciónenelestudiodelasprobabilidades.Mientrasquelavarianzainsesgada,esmáspropiciaparaloscálculosestadísticosyseempleageneralmenteparalasmuestras.
Hastaahorasehatrabajadosóloconmuestrasopoblacionesmenoresde30elementos,cuyoscálculosnohansidotanlaboriosos;peroquépasacuandolacantidaddedatosesconsiderableoéstosprovienendemedicionesquehaganmáslaboriosoelcálculodesusmedidascentralesodevariación.Ademásdeloanterior,puedeserquesólonecesitemosunresumenmáscompactodelconjuntodedatosoinclusotenerunarepresentacióngráficadelcomportamientodesudistribución,porloquesiendounconjuntocongrancantidaddedatos(porejemplo,200)visualizarlostodos,parapoderestudiarsudistribución,noes factible, por consiguiente, es necesario emplear alguna otra estrategia de análisis.
Dado un conjunto de datos, se llama intervalos de clase o clases de frecuencia o simplemente clases a los intervalos que por parejas son ajenos o disjuntos y contienen todos los datos del conjunto.
Una pareja de intervalos son disjuntos si no tienen elementos en común. Conrespectoalacantidaddeintervalosdeclase,sepidequenoseaunacantidadexcesivao insuficiente.Noexisteunaregladeterminanteparaobtener lacantidadde intervaloscuando se tienenn datos.Algunos especialistas en estadística emplean el enteromáscercanoalaraízden,otroselenteromáscercanoalog(n),obienla llamadaregladeSturges, en la cual se toma como el tamaño de la muestra el entero más cercano a3.3logn +1conncantidaddedatoscorrespondientesalasobservaciones.Paraefectosdeestelibro,seemplearáunacantidaddeintervalosque,dependiendodelvalorden,seencuentreentrecincoyveinte.
¿Qué es un intervalo de frecuencias y qué condiciones debe cumplir?
Definición 1.17
Nota
36 Estadística y probabilidad
1.7.1 Construcción de clases de frecuencia
Paralaconstruccióndelosintervalosdeclaseoclasesdefrecuenciaexistendiferentestécnicas, al igual que en la elección de la cantidad de clases no existe un métododeterminanteounafórmulageneral.Loúnicoquedeberespetarsees:
3. Paraformarlasclasesointervalos se considerancerradoslosextremosizquierdosdelosintervalosylosderechosseconsideranabiertos,tomandoalaúltimaclaseenambosextremoscerrada.
Elrangodelconjuntoes:r =75–5=70.Comoqueremostenerdiezintervalosdeclasedividimoselrango70entrediezyobtenemossiete.Estevalorserálalongituddecadaunadelasclases de frecuencia.Portanto,lasdiezclasesson
Empleamoslaconstruccióndelosintervalosdeclaseparaestudiardeformasimplificadala distribución de los datos, por tanto, después de construir los intervalos de clase,contamos la cantidad de datos que caen en cada uno. A dicha cantidad se le llamafrecuencia de la clase ofrecuencia de clase o frecuencia absolutaysesimbolizaporfi,dondeirepresentaelnúmerodelaclasey
f ii
nn=
=∑ 1
Se llama frecuencia relativa de una clase i al cociente de la cantidad de datos que se encuentran en ésta con respecto del total de datos en el conjunto y se simboliza por
ff
nri=
donde n representa la cantidad total de datos.
Ejemplo 12
Dado un conjunto de datos, ¿qué son las frecuencias de clase?
Definición 1.1�
37Unidad 1 • Estadística dEscriptiva
Seconsideranlascalificaciones(conescaladeceroa100)de80estudiantesenlamateriafísicaexperimental,sedistribuyenensieteclases de frecuenciasysecalculanlasfrecuencias relativasdelasclases:
Mientras que para el caso de la frecuencia relativa acumulada, las frecuenciasrelativasporclaseson
f
n
f
n
f
nm1 2, ,..., ;
secumplef
n
f
n
f
nm1 2 1+ + + =
y,portanto,setiene
Frecuencia relativa acumulada de una clase i es el cociente de la frecuencia acumulada de clase i entre la cantidad total de datos n, es decir
FF
nri=
Debidoaqueenlasfrecuenciasporclasenoesdeinteréselvalordecadaelementosinosólo la cantidaddeestosenlaclase,seacostumbrarealizarelconteopormediodelasbarrascomoantiguamentesellevabaacabo;esdecir,seponeunabarraverticalporelementocontadoycadavezquesellegaacuatrobarraslaquintasecolocaendiagonal.Porejemplo,paracontarochoelementos:
1.7.3 Media, mediana y moda en clases de frecuencia
Al igualque se realizó conunconjuntodedatosdel cual seobtuvieron susmedidascentralesydedesviación,éstassepuedenobtenerparalasclasesdefrecuenciaempleandolospuntosmediosdelasclasesysusfrecuenciasdeclase.
Sea k el número de clases, xi el punto medio de la i-ésima clase y fi la frecuencia de la i-ésima clase, entonces el valor de la media aritmética se calcula con la fórmula
xf x
ni i
i
k=
=∑ 1
Otrovalorpromedioimportanteeslamediana(Md ),quedivideladistribuciónendosáreasiguales;numéricamentesecomparaconlamediaaritmética x .
Si fi y xi son la frecuencia y el punto medio de la i-ésima clase, respectivamente, y n es la suma de las frecuencias, entonces la varianza sesgada s2 se calcula con la fórmula
sn
f x xi ii
k2 21
1
= −=∑ ( )
Ejemplo 14
Ejemplo 15
Solución
Definición 1.22
Solución
41Unidad 1 • Estadística dEscriptiva
La varianza insesgada s2 se calcula con la fórmula
sn
f x xi ii
k2 2
1
1
1=
−−
=∑ ( )
La desviación estándar por clases de frecuenciaseguirásiendolaraízcuadradapositivadelavarianzacorrespondiente.
Lamediayvarianzaporclasesdefrecuenciageneralmenteseempleanparaobservarladistribucióndedatosmuestrales,peroencasodequererdefinirestasmedidasparadatospoblacionalesserealizadeformasimilar,sustituyendolanporN, x porysporσ,comosehizoenlassecciones1.5y1.6.
Secalculalavarianzasesgadadelasclasesdefrecuenciaconlosdatosdelejemplo13.Para realizar loscálculosmás fácilmente seutilizará la tabla 1.2, tan sólo intro-a tabla1.2, tan sólo intro-tan sólo intro-
a) dividelosvaloresentresclasesdefrecuenciadeiguallongitud,calculasus frecuenciasrelativaseindicasielencargadotendráquerepararlamáquinaono b) calculalacantidaddelíquidopromedioquedespachalamáquina,empleando lasclasesdefrecuenciadelincisoanterior
Las gráficas a las que se hace referencia en estadística descriptiva deben mostrar ladistribucióndelasfrecuenciasofrecuenciasacumuladasdelconjuntodedatos,conlocualsepodráentendereinterpretarfácilmentesucomportamiento.
Unode los gráficosquemás se empleanpara representarunconjuntodedatos es eldiagrama de barras, donde se grafican una serie de rectángulos sobre un sistema dereferencia.Cuandoseconstruyenlosrectángulosconsusbasessobrecadaunodelosintervalosdeclaseyconsusalturaslasfrecuenciascorrespondientesdeclase,elgráficosellamahistograma.
Un histograma es un gráfico de barras utilizado para representar la forma en que están distribuidas las frecuencias; permite identificar el centro y la variabilidad de los datos.
mediosdelasclasesdefrecuencia,mientrasqueenelejedelasordenadasse distribuirán las frecuencias de los datos. Finalmente, se construye elhistogramagraficandounabarraporcadaclase,ycuyocentroseráelpuntomediodeésta,detalmaneraquelaalturadelabarraeslafrecuenciaofre-cuenciarelativaylabasedelosrectángulosestádefinidaporloslímitesdecadaclase.
Para facilitar la construcción de un histograma es recomendable emplear sólointervalosdeclasedeiguallongitud,yaqueendadocasolasfrecuenciasdelasclasessegraficandemaneraproporcionalalasalturasdelosrectángulosyademásesmuchomásfácilcompararlasdiferenciasentrefrecuenciascuandolosrectángulostienenlamismabase.
Segraficanlospuntosmediosdelosintervalos(terceracolumna)ysetrazanlosrectángulosconsusbases igualesa la longituddelaclaseyconlasalturascorrespon-dientesasufrecuencia,comosemuestraenlassiguientesfiguras:
de frecuencia y b) histogramas para las frecuencias acumuladas.
0
4
87
12
19
15
25 35 45 55 65 75 85 95 105
158
34
19
46
80
61
f
a)
025 35 45 55 65 75 85 95 105
F (x)
b)
Nota
45Unidad 1 • Estadística dEscriptiva
Histogramas simétricos
Presentanladistribuciónenformadecampana,esdecir,lamitadizquierdaesunaimagenreflejadadelamitadderecha.Comomuestralafigura1.2a,secumple x = Md=Mo.
Histogramas sesgados
Presentanunadistribuciónenlaquealgunadelascolasestámásalargadaencomparaciónconlaotra.Sellamansesgados a la derechaopositivamente sesgadossilacoladerechaeslaqueestámásalargada.Comolomuestralafigura1.2b,secumpleMo<Md< x .Selesllamasesgados a la izquierdaonegativamentecuandolacolaizquierdaeslamásalargada.Comolomuestralafigura1.2c,secumple x<Md<Mo.
Retomandolosdatosdelejemplo13ycomparandolosvalorespromediocalculados x =72,Md=75,Mo=92,elmodeloasociadoconlas80calificacionesdefísicaexperimentalessesgadoalaizquierda.
¿En una distribución de datosqué significa sesgo? ¿Qué forma tienen
los histogramas sesgados?
Figura 1.2Histogramas para las clases de frecuencia
a) simétrico; b) sesgado a la derecha; c) sesgado a la izquierda, y d) multimodal (bimodal).
a) b)
c) d)
Ejemplo 1�
46 Estadística y probabilidad
1.�.2 Polígono de frecuencias
Enciertasáreasdeestudioserequierequelasrepresentacionesgráficasdeladistribuciónde las frecuenciasdedatos seanhechaspor líneasen lugardebarras.Porejemplo,alrealizarunestudiosobrelospronósticosdealgúneventosevisualizamejorladistribucióndesusfrecuenciasysustendenciassiseunensuspuntosmediosconsegmentosrectilíneosenlugardetrazarbarras.
Un polígono de frecuencias es un gráfico de línea que representa las frecuencias de los datos, uniendo por líneas los puntos medios de cada intervalo, donde xi es el punto medio de clase i y fi su frecuencia. Debido a su forma también se le suele llamar gráfico poligonal.
Construcción de un gráfico poligonal
1. Secreanlosintervalosdeclase.2. Seencuentraelpuntomediodecadaintervalodeclase.3. En el plano cartesiano, en el eje de las abscisas, se distribuirán los puntos
mediosdelasclasesdefrecuencia,mientrasqueenelejedelasordenadassedistribuirán las frecuencias de los datos. Finalmente, se construye el gráficopoligonaluniendolospuntosobtenidos.
Lospolígonosdefrecuenciaseempleanfrecuentementeenelestudiode las series de tiempo, pues es común querer conocer la tendencia de la distribución de los datosconrespectoaltiempo.Además,enciertassituaciones,cuandosequierencompararlasdistribucionesdedosomásconjuntosdedatos,esmejorhacerlopormediodelospolígonosdefrecuenciasquemediantelasbarras,puestoquelosprimerossepuedensobreponeryrealizarunaobservaciónmuchomejor,loquenoesaplicableconloshistogramas.
Definición 1.25
Ejemplo 1�
Figura 1.3 Polígono de frecuencias.
f
12
478
0
19
15
35 45 55 65 75 85 95
47Unidad 1 • Estadística dEscriptiva
A los polígonos de frecuencia que se elaboran con las frecuencias acumuladas o las frecuencias relativas acumuladas se les llama ojivas.
Un diagrama circular es un gráfico que divide en sectores un círculo, los cuales representan las frecuencias relativas del conjunto de datos. Por su forma también se le suele llamar diagrama de pastel.
Con el avance de la informática y la creación de software, han aumentado lasrepresentacionesgráficasparalasdistribucionesdelosdatos;enestaunidadsólosehanilustradoalgunasdeellas.Acontinuaciónsemencionanotrostiposdediagramas: