Estadstica. Gua dE EjErcicios
Universidad Nacional de La Matanza, 2012Florencio Varela 1903 (B1754JEC)San Justo / Buenos Aires / ArgentinaTelefax: (54-11) [email protected]
Diseo: Editorial UNLaM
ISBN: 978-987-1635-81-8Hecho el depsito que marca la ley 11.723Prohibida su reproduccin total o parcialDerechos reservados
Estadstica : Gua de ejercicios / Mara Eugenia ngel ... [et.al.]. - 1a ed. - San Justo : Universidad Nacional de La Matanza, 2014. 84 p. ; 29x21 cm.
ISBN 978-987-1635-81-8
1. Estadsticas. 2. Enseanza Universitaria. I. ngel, Mara Eugenia CDD 519.507 11
EstadsticaGua de ejercicios
Contador PblicoLicenciado en Administracin
Comercio InternacionalLicenciado en Economa
Universidad Nacional de La Matanza
Docentes
Mara Eugenia ngel
Graciela Fernndez
Laura Polola
Mario Enrique Borgna
Mnica Gonzlez Camus
Silvia Brunetti
Liliana Pagano
Gabriela Beordi
Mnica Bortolotto
Sandra Rodrguez
Ingrid Colman
Universidad Nacional de La Matanza Estadstica
-1-
ndice
Tema Pgina
Introduccin 2 Programa 3 Esquema de la asignatura 5 Prctica 1: Introduccin a la estadstica - Procesamiento de los datos
Actividades propuestas 6 Pautas. Glosario 15
Prctica 2: Tipos de medidas Actividades propuestas 16 Pautas. Glosario 22
Prctica 3: Nmeros ndices Actividades propuestas 24 Pautas. Glosario 28
Prctica 4: Series de tiempo Actividades propuestas 29 Pautas. Glosario 34
Prctica 5: Clculo de probabilidades Actividades propuestas 35 Pautas. Glosario 42
Prctica 6 : Variable aleatoria Actividades propuestas 43 Teora de juegos 48 Pautas. Glosario 50
Prctica 7: Distribuciones especiales de probabilidad. Variables discretas Actividades propuestas 51 Glosario 55
Prctica 8: Distribuciones especiales de probabilidad. Variables continuas Actividades propuestas 56
Prctica 9: Distribuciones de estadsticos muestrales Actividades propuestas 61 Pautas. Glosario 63
Prctica 10: Estimacin de parmetros Actividades propuestas 64 Pautas. Glosario 69
Prctica 11: Prueba de hiptesis Actividades propuestas 70 Pautas. Glosario 73
Prctica 12: Anlisis de regresin y de correlacin Actividades propuestas 74 Glosario 78
Anexo. 79 Bibliografa. 81
Universidad Nacional de La Matanza Estadstica
-2-
ESTADSTICA
ESTADSTICA?
Qu es la estadstica?
La Estadstica se estructur, como disciplina cientfica, en el siglo XIX, pero ya se conoca y se
aplicaba en forma rudimentaria -se realizaban relevamientos de poblacin y de recursos- desde la
antigedad. Se puede afirmar que el quehacer estadstico es tan viejo como la historia registrada.
Si bien no hay una nica definicin de Estadstica, se puede aproximar diciendo que es la ciencia
de la recoleccin y anlisis de datos para la toma de decisiones, transformando datos en
informacin. En su mtodo comienza presentando tcnicas de diseo y recoleccin de datos
respecto a un fenmeno y luego mediante la estadstica descriptiva se resume lo medular de la
informacin. La inferencia estadstica extiende las conclusiones obtenidas de la muestra a la
poblacin de la que ella es parte, adems de postular modelos que se ajusten a los datos.
En el transcurso del presente curso trataremos algunas tcnicas de modelado estadstico, entre las
cuales se puede mencionar el diseo de modelos para los distintos tipos de variables, mtodos de
estimacin univariado y multivariado.
Universidad Nacional de La Matanza Estadstica
-3-
PROGRAMA DE LA ASIGNATURA
1- Introduccin a la estadstica.
Concepto de estadstica. Campos del conocimiento donde se origin y se aplica. Utilizacin de la
investigacin estadstica en la economa. Encuestas. Etapas del anlisis estadstico. Poblacin y
muestra. La unidad de observacin. Variables cualitativas y cuantitativas. Estadstica descriptiva e
inferencial. El INDEC y las Direcciones Provinciales de Estadstica.
2- Procesamiento de los datos.
Recopilacin y codificacin de los datos. Tabulacin de la informacin: matriz de datos. Distribuciones
de frecuencias para los distintos tipos de variables: frecuencias absolutas, relativas, porcentuales,
acumuladas. Representacin grfica: tortas, barras, bastones, escalones. Arreglo de datos ordenados.
Datos agrupados en intervalos de clase; grficos: el histograma de Pearson y la ojiva de Galton; sus
contextos histrico y disciplinar. Casos en los que se necesita agrupar en intervalos. Polgono de
frecuencias. Tablas de distribucin de frecuencias conjuntas; grficos.
3- Tipos de medidas.
Medidas de posicin: media (postulado de la media aritmtica de Gauss), mediana, modo, cuartiles,
deciles, percentiles. Medidas de dispersin o de variabilidad: rango, varianza de Gauss, desvo tpico o
estndar, desvo medio de Laplace, desvo intercuartil. Coeficiente de variacin de Pearson. Para cada
una de las medidas: definicin, propiedades, interpretacin, relaciones, determinacin analtica y
posibilidad de determinacin grfica en algunos casos. Medidas de intensidad: clculo e interpretacin
de razones y proporciones. Nociones sobre asimetra y curtosis. Grfico de caja y bigotes (box-plot) de
Tukey: construccin, anlisis e interpretacin y comparacin de distribuciones de datos.
4- Nmeros ndices.
Definiciones, aplicaciones y propiedades. Clasificacin. Problemas implicados en el clculo de
nmeros ndices. Enlaces y cadenas relativas. Cambio del perodo base en los nmeros ndices. ndices
simples y compuestos. ndices de precio, cantidad y valor. Nmeros ndice de Laspeyres, Paasche y
Fisher. Contextos histrico y disciplinar. ndices generales de precios del INDEC: IPC, IPIM e ICC.
ndices especiales. Indice deflactor. Ingreso real. Poder adquisitivo del dinero.
5- Series de tiempo.
Nociones bsicas. Componentes en el dominio de tiempo: secular, cclica, estacional e irregular.
Grficos. Anlisis de las componentes: obtencin de la recta de tendencia secular (mtodo de los
mnimos cuadrados), clculo de los ndices estacionales (mtodo del promedio mvil) y de la
fluctuacin cclica (mtodo del porcentaje de la tendencia y de los residuales cclicos relativos).
Pronosticacin.
6- Probabilidad.
Experimentos determinsticos y aleatorios. Espacios muestrales. Sucesos aleatorios. Sucesos
elementales, suceso cierto y sucesos imposibles. Operaciones entre sucesos. Relaciones de exclusin y
de independencia estadstica entre sucesos aleatorios. Probabilidad: definiciones clsica de Laplace y
frecuencial de Von Mises. Algebra de las probabilidades: axiomas y teoremas. Contextos histrico y
disciplinar. Tipos de probabilidad: total, compuesta y condicional. Asignacin de probabilidad a
espacios muestrales finitos y equiprobables. Tablas de contingencia: probabilidades compuestas o
conjuntas y probabilidades marginales o totales. Diagrama de rbol: probabilidades normales totales y
condicionales. Teorema de la probabilidad total. Teorema de Bayes o de la probabilidad condicional de
las causas.
Universidad Nacional de La Matanza Estadstica
-4-
7- Variable aleatoria. Concepto. Variables aleatorias discretas y continuas. Funciones de probabilidad y de distribucin de
una variable aleatoria discreta, propiedades. Funciones de densidad de probabilidad y de distribucin de
una variable aleatoria continua, propiedades. Esperanza matemtica: definicin y propiedades. Varianza
y desvo estndar: definicin y propiedades. Clculo de esperanza y varianza de variables aleatorias
discretas y continuas. Grficos para funciones de probabilidad y de distribucin.
8- Modelos especiales de probabilidad.
Modelos probabilsticos discretos y continuos. Para variables aleatorias discretas: Bi-nomial, de
Bernoulli, hipergeomtrico y de Poisson. Aproximacin de la distribucin Binomial por Poisson. Para
variables aleatorias continuas: Normal, Normal Estndar, t de Student, Uniforme, Exponencial y Chi
cuadrado. Para cada caso: caractersticas del modelo, fenmenos al que responde el mismo, posibilidad
de aplicacin, funciones de probabilidad y de distribucin, clculo e interpretacin de la esperanza y
varianza. Uso de tablas.
9- Informacin muestral. Representatividad. Diferencia entre censos y muestras. Tcnicas de seleccin de muestras. Distintos
tipos de muestreo. Estadsticos muestrales, concepto y propiedades.
10- Distribucin de estadsticos muestrales.
Distribuciones de estadsticos muestrales: la media, la proporcin y la varianza muestrales.
Propiedades. Error estndar. Propiedades de un buen estimador. Muestreo en poblaciones normales: las
distribuciones t de Student y Chi-Cuadrado de Helmert. La distribucin normal como lmite de la distribucin de los estadsticos muestrales. Teorema central del lmite.
11- Estimacin de parmetros por intervalos de confianza.
Inferencia estadstica, estimacin puntual y estimacin por intervalos de confianza. Concepto.
Fundamentos. Nivel de confianza. Precisin de la estimacin. Estimacin de la media, la proporcin, la
varianza y el desvo estndar de una poblacin. Determina-cin del tamao de la muestra. Aplicaciones
del teorema central del lmite.
12- Ensayo de Hiptesis.
Test de hiptesis, concepto general. Fundamentos. Hiptesis estadsticas simples y compuestas.
Hiptesis nula y alternativa. Punto crtico. Nivel de significacin. Tipos de errores. Regin crtica o de
rechazo de la hiptesis nula y regin de aceptacin o de no rechazo. Estadsticos de prueba y reglas de
decisin. Procedimientos. Pruebas para la media, la varianza y las proporciones poblacionales.
Aplicaciones del teorema central del lmite. Pruebas de una o dos colas.
13- Anlisis de regresin y de correlacin.
Conceptos. Regresin lineal simple. Diagrama de dispersin. Anlisis de correlacin: correlacin lineal,
clculo de los coeficientes de determinacin y de correlacin; su significado. Anlisis de regresin
simple: recta de regresin por el mtodo de cuadrados mnimos, lmites de aplicabilidad del modelo.
Regresin no lineal. Nociones de regresin mltiple. Prueba de hiptesis sobre el coeficiente de
correlacin y los parmetros de la regresin.
Universidad Nacional de La Matanza Estadstica
-5-
ESQUEMA DE LA ASIGNATURA
Introduccin a la estadstica Etapas en el anlisis estadstico. Poblacin y
muestra. Variables cualitativas y cuantitativas.
Procesamiento de los datos. Tabulacin y representacin grfica
Tipos de medidas Medidas de posicin de dispersin
y de intensidad
Nmeros ndices..
Probabilidad. Definicin. Asignacin Variables aleatorias..
Discretas y continuas.
Funciones de probabilidad.
Esperanza Varianza y desvo
Modelos especiales de probabilidad Discretos y continuos
Informacin muestral Distribucin de estadsticos muestrales Teorema central del lmite
Estimacin puntual y por intervalos Conceptos. Lmites de confianza. Seleccin de n
Ensayo de Hiptesis. Hiptesis estadsticas. Tipos de error.
Estadsticos de prueba y regla de decisin
Anlisis de regresin y de correlacin Lineal. Clculo de coeficientes. Posibilidad
Series de tiempo Anlisis de tendencias y variaciones.
Universidad Nacional de La Matanza Estadstica
-6-
PRCTICA 1
INTRODUCCIN A LA ESTADSTICA - PROCESAMIENTO DE LOS DATOS
En esta prctica se tratarn diversas maneras de organizar los datos y preparar el
material de base para que en adelante se puedan elaborar indicadores estadsticos o
medidas estadsticas. Cada forma de organizacin, implica la caracterizacin de
distintos espacios abstractos donde a posteriori se disearan las medidas estadsticas.
1- En un informe del Indec se muestran datos relevados de 400 grandes empresas nacionales y
extranjeras que brindaron informacin relevante respecto a la situacin de la competitividad y
las perspectivas y obstculos a la inversin en distintos sectores. El relevamiento se realiz a
travs de la Encuesta Nacional sobre Competitividad e Inversin. (ENCI, 31/01/2014, Ver en http://www.indec.mecon.ar/nuevaweb/cuadros/16/enci_31_01_14.pdf)
A continuacin se presenta un resumen de parte de la informacin brindada en formato de
grfico o tabla.
Razones que motivan la nueva inversin % Factores relevantes frente a competidores
del exterior (producto principal) %
Reponer maquinaria y equipo por desgaste
Mejorar la calidad de los equipos / servicios que
produce
Incrementar la productividad
Desarrollar nuevos productos / servicios
Responder a incrementos en la demanda interna
Eficiencia energtica
Incrementar la cuota de mercado / conquistar nuevos
mercados locales
Alcanzar nuevos mercados de exportacin
Sustitucin de insumos importados
Responder a incrementos en la demanda externa
Expandirse hacia otras actividades productivas
Otras
15,9
12,7
17,9
9,6
9,4
7,6
6,3
5,9
5,7
4,6
2,7
1,7
Precio
Problemas de escala
Calidad
Problemas de abastecimiento
Plazos de entrega
Costos de entrega
Financiamiento
Condiciones y forma de pago
Otros
36,1
5,2
0,8
12,9
4,0
11,2
7,6
10,0
12,0
Fuente: Encuesta Nacional de Competitividad e Inversin Fuente: Encuesta Nacional de Competitividad e Inversin
Tabla 1 Tabla 2
Grfico 1
Universidad Nacional de La Matanza Estadstica
-7-
Grfico 2
Factores relevantes frente a competidores del exterior (producto principal), segn grupo de actividad (en %)
Grupo de actividad Precio
Problemas
de escala /
falta de
capacidad instalada
Calidad
Problemas
de abas-
tecimiento de materias
primas e
insumos
Plazos
de entre-
ga
Costos de
entrega
(empaque flete,
seguros,
etc.)
Finan-
cia-
miento
Condi-
ciones y formas
de pago
Otros
Alimentos, bebida y tabaco
Textiles, Productos de vestir y Calzados
Papel y Productos de madera Qumicos, Farmacuticos y Plstico
Productos metalrgicos y minerales
Maquinarias y Equipos Vehculos y Mquinas de transporte
Energa y Comercio
Transporte y logstica
Total
9,7
2,0
2,0 8,9
3,7
3,3 4,5
0,4
1,6
36,1
1,6
0,4
0,4 1,6
0,0
0,4 0,4
0,0
0,4
5,2
0,0
0,0
0,0 0,4
0,4
0,0 0,0
0,0
0,0
0,8
4,1
0,8
0,4 4,8
0,0
1,2 0,8
0,8
0,0
12,9
0,8
0,4
0,0 2,0
0,0
0,3 0,4
0,0
0,0
4,0
6,8
0,0
0,8 2,0
0,0
0,0 1,6
0,0
0,0 11,2
2,4
0,0
0,4 1,6
0,8
1,6 0,8
0,0
0,0
7,6
2,9
0,0
0,5 2,9
1,3
1,2 0,9
0,0
0,5
10,0
4,9
0,5
0,0 3,7
0,5
0,5 0,4
0,8
0,9
12,0
Fuente: Encuesta Nacional de Competitividad e Inversin
Tabla 3
a) Identificar para cada uno de los grficos y tablas la variable y el tipo de variable analizada. b) Transcribir la informacin de los grficos a tablas de distribucin de frecuencias que
incluyan las frecuencias absolutas aproximadas y relativas simples correspondientes.
c) Construir grficos que expresen la informacin de las Tablas 1 y 2. d) Con la informacin de la Tabla 3 completar el siguiente extracto con las frecuencias
absolutas simples aproximadas correspondientes a las siguientes categoras:
Grupo/Factores Precio Problemas de
abastecimiento
Costos de
entrega
Alimentos, Bebidas y Tabaco 39 16 27
Qumicos, Farmacuticos y Plsticos
Vehculos y Maquinas de Transporte
e) Para graficar la informacin del extracto realizado de la Tabla 3, se utilizara el mismo grfico que en el tem c)? Construir un grfico adecuado utilizando las categoras incluidas
en la tabla de frecuencias absolutas.
42,5
28,6 27,4
1,5
0
10
20
30
40
50
Se encuentra al nivel de las mejores plantas
internacionales
Se encuentra al nivel de las mejores plantas del
MERCOSUR
Se encuentra al nivel de las mejores plantas
nacionales
Est por debajo del nivel de las mejores plantas
nacionales
po
rce
nta
jeEvaluaciones de la produccin respecto a los parmetros
internacionales, regionales y nacionales
Universidad Nacional de La Matanza Estadstica
-8-
Grfico 3
2- La informacin que sigue fue extrada de la seccin Infogrficos Estadsticos publicados en la pgina web de la Comisin Econmica para Amrica Latina (CEPAL). (http://estadisticas.cepal.org/cepalstat/WEB_CEPALSTAT/Library/CEPALSTAT/Infograficos_pdf/Inf_10_es.pdf.)
Fuente: CEPALSTAT sobre la base de encuestas de hogares de los pases de la regin. 2010
Universidad Nacional de La Matanza Estadstica
-9-
a) Identificar las variables intervinientes y clasificarlas. b) Compilar toda la informacin en una tabla de distribucin conjunta. c) Realizar otro tipo de grfico con la informacin disponible. d) En qu se diferencia la tabla de frecuencias conjuntas de este ejercicio y la analizada en
el anterior?
3- La siguiente informacin fue extrada de la pgina web del Indec: (Ver en http://www.indec.mecon.ar/nuevaweb/cuadros/5/P29-Total_pais.xls)
a) Identificar las variables intervinientes y clasificarlas. b) Graficar la informacin compilada utilizando las frecuencias porcentuales respectivas a
cada sexo.
4- La siguiente informacin fue extrada de la pgina web del Indec. (Ver en http://www.indec.mecon.ar/nuevaweb/cuadros/9/f030906.xls)
2008 2012
Total del pas 119,1 96,5
Revistas nacionales 108,9 90,4
Tcnicas 3,6 2,4
Didcticas 18,9 17,3
Ilustradas 2,7 2,6
Mujer y hogar 19,6 17,1
Deporte y tiempo libre 16,7 11,7
Artes y espectculos 2,1 1,1
Inters general 38,3 35,0
Otras 7,0 3,2
Revistas extranjeras 10,2 6,1
Nota: se considera circulacin bruta de revistas a la tirada total de las mismas.
Fuente: Asociacin Argentina de Editores de Revistas.
Circulacin bruta de revistas nacionales y extranjeras por gnero.
Total del pas. Aos 2008-2012
Miles de ejemplares
Circulacin de revistas
Tipo de revistas y gnero
Universidad Nacional de La Matanza Estadstica
-10-
a) Identificar las variables intervinientes y clasificarlas. b) Graficar la informacin compilada utilizando las frecuencias porcentuales respectivas a
cada ao.
5- En un centro comercial barrial se realiza un estudio sobre un conjunto de negocios minoristas
acerca de la cantidad de empleados que posee cada uno, registrndose la siguiente
informacin.
Empleados 0 1 2 3 4 5
Cantidad de Establecimientos 2 4 5 6 4 2
a) Identificar la variable en estudio y clasificar. b) Obtener las frecuencias relativas simples y acumuladas. c) Realizar un grfico para cada una de las frecuencias obtenidas. d) Extraer conclusiones de la observacin de los grficos.
6- El departamento de personal de una determinada empresa registr la cantidad de das de
ausentismo debido a causas personales de sus 115 empleados, en el perodo de un ao
determinado, obtenindose:
Cant. de das 0 1 2 3 4 5 6 7 8 10 total Cant. de empleados 5 19 27 35 10 8 6 3 1 1 115
a) Representar grficamente las frecuencias porcentuales simples y las acumuladas.
b) De la observacin de las frecuencias acumuladas extraer alguna conclusin.
7- Los datos que se dan a continuacin corresponden a la cantidad de prstamos otorgados, en
una semana determinada, por 56 entidades financieras, la finalidad de los mismos fue la
adquisicin de viviendas de uso particular.
2 9 14 19 4 7 14 8 13 3 1 19 5 5 15 6 1 8 5 6
10 11 20 7 2 8 10 6 11 5 15 1 9 8 8 21 17 17 6 5 1
2 1 4 22 20 10 6 11 3 2 3 10 4 15 10
a) Listar los datos de menor a mayor.
b) Confeccionar la tabla de distribucin de frecuencias.
c) Graficar las frecuencias porcentuales simples y acumuladas.
d) Determinar grficamente el porcentaje de entidades que otorgaron:
i) menos de 12 prstamos para la adquisicin de viviendas.
ii) al menos 8 prstamos para la adquisicin de viviendas.
iii) ms de10 y hasta 20 prstamos.
iv) a lo sumo 15 prstamos.
e) Agrupar los datos en siete intervalos de igual amplitud y elaborar la tabla correspondiente.
f) Graficar las frecuencias porcentuales simples y acumuladas.
g) Determinar grficamente los mismos porcentajes solicitados en d).
h) Comparar los grficos realizados en c) y en f).
i) Comparar los resultados obtenidos en d) con los obtenidos en g).
Universidad Nacional de La Matanza Estadstica
-11-
8- Los montos otorgados en 50 prstamos personales (en miles de pesos), por una determinada
entidad bancaria, son las siguientes:
90,32 50,15 40,52 190,00 120,00 120,78 250,40 50,85 160,50 120,19 100,00 50,54
90,73 60,60 70,20 130,88 80,51 30,29 140,23 70,27 30,56 110,90 30,00
160,10 150,25 100,00 180,90 90,35 50,92 60,55 220,27 90,54 210,12 40,45 70,84
80,70 60,30 300,00 30,34 150,90 200,50 60,85 170,40 90,29 100,09 60,45 80,65
16,60 80,71 130,29
a) Listar los datos de menor a mayor.
b) Agrupar los datos en 5 intervalos y en 10 intervalos, haciendo coincidir en los dos
agrupamientos, el lmite inferior del primer intervalo y el lmite superior del ltimo.
c) Para cada caso construir la distribucin de frecuencias correspondiente.
d) Realizar los histogramas y los polgonos de frecuencias porcentuales y compararlos.
9- La informacin tabulada a continuacin se extrajo de la pgina web del Indec. (Ver en http://www.indec.mecon.ar/nuevaweb/cuadros/4/f030703.xls)
a) Identificar y clasificar las variables en estudio. b) Calcular las frecuencias relativas segn sexo tanto para jubilaciones como para pensiones. c) Graficar y comparar los histogramas de frecuencias relativas para mujeres y varones
simultneamente para jubilaciones.
d) dem para pensiones y sacar conclusiones.
10- La siguiente informacin corresponde a salarios diarios del total de obreros de cierta
industria.
SALARIO DIARIO 30-32 32-34 34-36 36-38 38-40 40-42
NMERO DE OBREROS 5 22 30 28 10 2
a) Completar la tabla de distribucin de frecuencias.
Universidad Nacional de La Matanza Estadstica
-12-
b) Representar grficamente los distintos tipos de frecuencias simples.
c) Discutir las propiedades que tiene cada uno de los grficos (sugerencia: comparar reas).
d) Representar las frecuencias porcentuales acumuladas.
e) Determinar grficamente el salario mximo de i) la mitad de los empleados, ii) la cuarta
parte de los obreros y iii) las tres cuartas partes de los obreros.
11- A cada trabajador se le otorga una tasa de produccin que representa su eficiencia en el
trabajo. Las tasas se organizaron en una distribucin de frecuencias y despus se
representaron en forma de un polgono de frecuencias acumuladas.
a) Marcar en el grfico la tasa mxima de produccin que posee el 50% de los empleados.
b) Reconstruir la tabla de distribucin de frecuencias.
c) Confeccionar el histograma correspondiente.
d) Marcar en el grfico la tasa que predomina.
e) Encontrar el porcentaje de empleados que poseen una tasa de produccin inferior 110.
f) Encontrar el porcentaje de empleados que poseen una tasa de produccin superior a 130.
g) Cul es la tasa de produccin aproximada otorgada como mximo al 75% de los
empleados?
Como se evidencia en este ejercicio, el grfico de la ojiva de Galton -que conlleva el
concepto de acumulacin de frecuencias- permite extraer informacin del conjunto de
datos desde otro ngulo.
A pesar de que el concepto de acumulacin parece surgir naturalmente a posteriori del
de frecuencia simple, en la realidad histrica se formaliz antes: el grfico de la Ojiva
de Galton precedi al histograma de Pearson en ms de una dcada.
12- El siguiente conjunto de datos representa gastos por consumo semanal de alimentos per
cpita de 100 familias escogidas al azar en una localidad del Gran Buenos Aires.
0
5
10
15
20
25
30
35
40
45
50
55
80 90 100 110 120 130 140
12
Tasas
Nro
acu
mu
lad
o d
e
em
ple
ad
os
Universidad Nacional de La Matanza Estadstica
-13-
a) Ordenar los datos de menor a mayor.
b) Agrupar los datos en 6 intervalos y en 12 intervalos, haciendo coincidir en los dos
agrupamientos, el lmite inferior del primer intervalo y el lmite superior del ltimo.
c) Para cada caso elaborar la distribucin de frecuencias.
d) Realizar, para cada distribucin, el polgono de frecuencias porcentuales y compararlos.
13- A continuacin se consignan los dimetros de 200 arandelas seleccionadas al azar entre todas
las producidas por una fbrica. Agrupar los dimetros en 7 intervalos de amplitud 0,02 a
partir de 1,40 y graficar convenientemente
1,51 1,49 1,52 1,45 1,46 1,43 1,50 1,50 1,47 1,49 1,46 1,45 1,50 1,45 1,45 1,49 1,48 1,48 1,49 1,49 1,47 1,45 1,49 1,51 1,48 1,48 1,47 1,52 1,51 1,45 1,46 1,52 1,51 1,45 1,50 1,47 1,51 1,51 1,51 1,47 1,48 1,47 1,53 1,48 1,47 1,47 1,46 1,48 1,48 1,46 1,51 1,47 1,51 1,51 1,44 1,50 1,50 1,51 1,49 1,50 1,45 1,45 1,47 1,47 1,46 1,52 1,45 1,48 1,50 1,47 1,48 1,49 1,49 1,46 1,42 1,46 1,46 1,50 1,45 1,49 1,44 1,48 1,51 1,46 1,47 1,47 1,48 1,44 1,48 1,48 1,46 1,48 1,47 1,50 1,48 1,49 1,50 1,51 1,49 1,49 1,49 1,51 1,52 1,51 1,49 1,48 1,44 1,48 1,47 1,49 1,47 1,52 1,50 1,49 1,49 1,46 1,49 1,51 1,42 1,44 1,50 1,45 1,47 1,43 1,44 1,49 1,49 1,49 1,46 1,43 1,48 1,47 1,47 1,50 1,49 1,48 1,47 1,46 1,48 1,45 1,45 1,48 1,49 1,50 1,48 1,48 1,48 1,49 1,43 1,47 1,50 1,47 1,50 1,49 1,45 1,52
1,50 1,46 1,44 1,48 1,48 1,46 1,47 1,48 1,51 1,48 1,49
1,44 1,44 1,45 1,48 1,46 1,48 1,48 1,49 1,46 1,45 1,45
1,49 1,47 1,48 1,47 1,47 1,49 1,48 1,49 1,50 1,42 1,45
1,49 1,47 1,49 1,48 1,41 1,47 1,51 1,48 1,45 1,44 1,49
14- Analizar si las siguientes afirmaciones son verdaderas siempre-a veces-nunca. Justificar.
a) Si una variable adopta valores numricos es cuantitativa.
b) Si una variable es cualitativa no es ordenable.
c) Una variable continua no puede trabajarse como discreta (discretizacin).
d) Una variable discreta puede trabajarse como continua.
e) De una tabla de frecuencias de una variable discreta (o discretizada) pueden recuperarse los
datos originales.
f) De una tabla de frecuencias de una variable agrupada en intervalos de clase pueden
recuperarse los datos originales aproximados.
g) Desde cualquier grfico es posible reconstruir la tabla de frecuencias que le dio origen.
40,50 20,65 19,10 30,45 42,70 29,95 23,70 33,10 23,60 30,70 39,40 29,80 39,55 21,90 23,10 53,10 43,70 72,40 58,90 20,27 46,50 47,20 88,00 43,90 33,30 63,90 33,20 43,90 27,85 26,80 51,34 52,90 78,90 33,70 49,30 75,30 45,10 37,90 43,10 31,55 60,00 39,55 69,45 45,95 29,90 53,90 23,10 65,30 33,90 70,80 43,20 72,70 55,50 33,90 34,65 62,65 32,15 43,90 45,30 65,45 57,30 71,10 67,30 39,65 39,90 30,75 52,60 72,65 23,90 45,30 68,40 63,70 39,45 27,99 49,30 43,65 38,75 29,30 32,65 38,10 47,30 58,40 46,00 29,15 63,90 71,00 19,99 37,20 41,20 29,90 29,95 39,65 61,80 37,70 39,65 38,90 29,35 28,70 30,50 24,50
Universidad Nacional de La Matanza Estadstica
-14-
15- Los siguientes datos corresponden a una muestra aleatoria de 40 empresas PyMEs extrada
del Censo Nacional Econmico 2004/2005
Donde: Tipo de PyME: R: recuperada; P: privada. Rubro: A: Agrcola; C: comercial; I: industrial; S: servicios.
Antigedad, en aos, al 2005. Nivel de endeudamiento: N: ninguno; B: bajo; M: medio; A: alto; MA: muy alto.
Puestos de trabajo durante 2003-2005: D: disminuy; M: mantuvo; A: aument.
a) Identificar y clasificar todas las variables cuyos valores estn volcados en la matriz.
b) Para cada una de las variables confeccionar una tabla de distribucin de frecuencias y graficar
convenientemente.
c) Realizar una tabla de distribucin de frecuencias conjuntas y graficar.
Tipo Rubro Antige-dad
Endeuda-
miento
Cant. de
personal
Puestos
1 P S 1 M 128 M
2 P I 6 M 150 D
3 R A 8 N 19 A
4 R C 4 M 170 M
5 P I 8 MA 112 M
6 P A 3 A 140 D
7 R I 10 B 20 A
8 P S 8 MA 23 D
9 P C 4 M 114 M
10 P A 0 MA 148 A
11 R A 2 M 154 A
12 P I 4 B 100 D
13 P C 5 MA 270 D
14 R I 6 A 142 A
15 P A 7 MA 105 M
16 R I 2 A 160 M
17 P C 9 M 22 M
18 R I 17 B 5 M
19 P S 11 M 120 D
20 P I 6 N 137 A
21 P I 7 M 80 D
22 R A 4 A 109 M
23 R C 25 MA 110 A
24 P S 11 B 144 A
25 P C 4 M 120 A
26 R I 7 M 110 M
27 P S 9 A 98 M
28 P S 6 B 67 D
29 P C 10 A 115 D
30 P C 1 N 21 M
31 R S 5 N 109 M
32 R I 2 M 125 M
33 R A 8 MA 34 A
34 P A 0 B 99 A
35 R I 15 M 132 D
36 P S 8 N 165 A
37 P S 6 M 38 M
38 R I 3 A 25 M
39 R A 5 M 9 M
40 P S 2 N 115 A
Universidad Nacional de La Matanza Estadstica
-15-
Pautas a considerar
La cantidad de informacin que pueda extraerse de una variable, tiene relacin directa con la
cantidad de espacios abstractos que ella permita. Comparativamente, las variables cuantitativas
pueden dar mayor cantidad de informacin que las cualitativas ordenables y stas ms que las
no ordenables. Las cuantitativas disponen de cuatro espacios para disear indicadores, las
cualitativas ordenables de tres espacios y las no ordenables de slo dos.
Los grficos elaborados permiten tener una idea de conjunto complementando la lectura de la
informacin que se extrae del grupo de datos relevados. Su objetivo principal es maximizar la
extraccin de la informacin contenida en los datos empricos.
Cuando se habla de poblacin no necesariamente sta es un conjunto de personas. Se podran
estudiar, por ejemplo, todas las unidades econmicas de la Argentina (como en el caso del censo
nacional econmico2004/2005). En este caso la poblacin comprendera desde kioscos,
almacenes, supermercados, talleres automotrices, talleres y fbricas textiles hasta grandes
industrias siderrgicas y petroleras de la Argentina donde cada una de esas unidades
econmicas ser una unidad de observacin y/o de anlisis. Si el relevamiento se realizara a
slo una parte de esa poblacin se tratara de un muestreo y no de un censo.
Glosario
Poblacin objetivo: es la coleccin de todos los miembros concebibles del grupo que deseamos
estudiar.
Unidad de observacin estadstica: es el objeto o individuo sobre el cual se realiza la
observacin, se relaciona ntimamente con el grado de detalle con que se planifica estudiar la
poblacin.
Muestra representativa: es un subconjunto de la poblacin que debe reflejar sus caractersticas.
Variable estadstica: cualquier aspecto o caracterstica que varia de un individuo a otro y que se
desee estudiar en la poblacin. Se desprende de algn/os atributo/s relevado/s.
Matriz de datos: arreglo que incluye conjuntamente los atributos relevados y las unidades
observadas.
Datos crudos o brutos: datos colectados en un relevamiento y no organizados de forma alguna.
Arreglo de datos ordenados: son los datos colectados ordenados en forma ascendente o
descendente segn los valores numricos o categoras ordenables de una variable.
Frecuencia simple: cantidad de veces que aparece un valor de la variable, o su porcentaje, o su
cantidad relativa.
Frecuencia acumulada: cantidad o porcentaje de datos que se acumulan hasta un cierto valor de
la variable.
Distribucin de frecuencias: tabla donde se listan todos los valores de la variable junto con sus
correspondientes frecuencias.
Universidad Nacional de La Matanza Estadstica
-16-
PRCTICA 2
TIPOS DE MEDIDAS
Toda ciencia es medicin, toda medicin es estadstica. Hermann L.F. de HELHOMTZ (fsico y fisilogo alemn-s.XIX)
Precisamente, en esta prctica se comenzar a medir sobre el conjunto de datos con la
finalidad de determinar sus caractersticas principales.
Las medidas que se determinarn son los denominados indicadores estadsticos del
grupo de datos. La interpretacin que se realice de cada uno de estos indicadores debe
referirse estrictamente al grupo de datos tratados.
1- Con la informacin de las tablas y grficos del ejercicio 1 (Prctica 1) responder:
a) Cul es la proporcin de empresas que opinan que el factor predominante frente a los
competidores del exterior es el precio?
b) Qu porcentaje de empresas prevn nuevas inversiones respecto a las que no las prevn?
c) Cul es la razn que motiva la nueva inversin que predomina?
d) Cul fue el grupo de actividad y factor relevante frente a competidores extranjeros que
posee mayor frecuencia?
e) Cul es la evaluacin de la produccin respecto a parmetros internacionales, regionales y
nacionales que predomina?
f) Por cada empresa que considera que el factor relevante frente a competidores extranjeros es
el financiamiento, cuntas opinan que es el precio?
g) Para cada tem anterior indicar la medida y tipo de medida utilizada para responder.
2- Con respecto al ejercicio 3 de la P1.
a) Cul es la proporcin de varones que tienen cmo mnimo el secundario completo? b) Para qu sexo es mayor la proporcin de personas que tienen un nivel de educacin Post
universitario?
c) Cul es la proporcin de mujeres con estudios universitarios completos? d) Hallar la razn entre los varones que poseen estudios universitarios y las mujeres con el
mismo nivel de estudios.
e) Para cada nivel de educacin alcanzado calcular la razn entre varones y mujeres y comparar los resultados.
f) Por cada persona que tiene slo primario incompleto, cuntas tienen el secundario completo?
g) Qu nivel de educacin es el predominante para cada sexo? h) La frecuencia 3.249.344 de la tabla conjunta, qu medida de posicin permite determinar?
Interpretarla.
3- Con los datos de la tabla del ejercicio 4 de la P1, extraer cuatro conclusiones identificando en
cada una la medida utilizada.
4- Utilizando los datos del ejercicio 5 de la P1 determinar, identificando en cada caso, la medida
utilizada:
Universidad Nacional de La Matanza Estadstica
-17-
a) La proporcin de negocios que poseen al menos tres empleados.
b) El nmero medio de empleados por establecimiento.
c) Por cada establecimiento que posee como mucho un empleado, cuntos poseen al menos
dos?
d) La cantidad de empleados que poseen como mnimo el 50% de los negocios.
e) La cantidad de empleados que predominan en la muestra.
f) Ms de cuntos empleados posee el 75% de los establecimientos?
5- Una compaa tiene un crdito abierto con un banco. El prstamo mostr los siguientes saldos
mensuales finales, en pesos, durante el ao:
330,40 250,50 195,70 160,35 319,30 210,20 198,50 160,35 285,70 210,20 185,00 152,10
Se sabe que la compaa ser elegida para recibir una tasa reducida de inters si su saldo
mensual promedio es mayor de $215; cumple la compaa con tal requisito?
6- Un vendedor viajante hizo cinco viajes durante los meses de Junio y Julio de 2006. El nmero
de das y el valor de las ventas de cada viaje son los siguientes:
Viaje N de das Valor de las ventas en $ Ventas por da en $
1 7 1750 250
2 8 3200 400
3 10 3000 300
4 3 840 280
5 9 3870 430
El gerente de ventas critic la actuacin del vendedor porque sus ventas medias por da slo
ascendieron a $332. Pero el vendedor dijo que el gerente de ventas estaba equivocado porque
sus ventas medias por da fueron superiores a $340. Quin est en lo correcto?
7- El salario medio anual en una empresa es de $21.000. Los de hombres y mujeres fueron,
respectivamente, de $21.840 y 17.640 en promedio. Hallar el porcentaje de mujeres
empleadas en esa empresa.
8- Discutir y analizar el grado de veracidad de los siguientes enunciados.
a) El lugar geomtrico de la media aritmtica en el eje real es el centro de la distribucin de datos.
b) Todos los conjuntos de datos tienen promedio. c) En el clculo de la media aritmtica influyen los valores extremos. d) El valor del promedio supera a los valores que toman la mitad de los datos ordenados.
9- Una pizzera con entregas a domicilio ha prosperado mucho, pues entrega las pizzas en muy
poco tiempo. La pizzera garantiza que sus pizzas se recibirn en 30 minutos o menos despus
de hacer el pedido; si la entrega se retrasa, la pizza es gratis. El tiempo que se tarda en realizar
cada pedido surtido puntualmente se anota en el registro de la pizzera y el tiempo de entrega
de los pedidos que se surten en retraso se anota como 30 minutos en el registro. A
continuacin se incluyen 14 anotaciones aleatorias del registro.
15,3 29,5 30 10,1 30 19,6 30 10,8 12,2 30 14,8 30 22,1 18,3
a) Encuentre la media del tiempo de entrega anterior.
Universidad Nacional de La Matanza Estadstica
-18-
b) Si dos de las anotaciones corresponden a tiempos de 32 y 36 minutos, puede esta muestra emplearse para estimar el tiempo promedio que tarda la pizzera en entregar un pedido?
Explique su respuesta.
c) Encontrar el promedio real de los tiempos de entrega. d) Validar y discutir los clculos realizados en a) y c).
10- Colocar verdadero (V) o falso (F) segn corresponda. En caso de ser falso explicar porqu.
a) Para determinar la mediana se tienen en cuenta el valor de cada uno de los datos.
b) El valor que ms se repite en un conjunto de datos recibe el nombre de media aritmtica.
c) Para un conjunto ordenado de 50 observaciones, la posicin de la mediana ser el valor de
la vigsimo quinta observacin en el arreglo.
d) Los valores extremos de una distribucin no influyen en la determinacin de la mediana.
11- Una fbrica de electrodomsticos, para atender a la demanda de un mes determinado requiri
de diferentes clases de mano de obra en las siguientes cantidades:
Mano de obra Cantidad de horas Tasa salarial ($ por hora)
Calificada 70 25
Semicalificada 130 12
no calificada 400 5
a) Cul fue el costo medio de la mano de obra por hora? y con qu varianza?
b) Por qu es necesario elevar al cuadrado las diferencias entre la media y los valores de los
que se obtuvo el promedio, cuando se calcula la varianza de la poblacin?
c) Calcular la proporcin de mano de obra semicalificada.
d) Cul es la razn entre la mano de obra calificada y la mano de obra no calificada?
e)Cul es la razn entre la mano de obra semicalificada y la calificada?
12- En un centro mdico se observa especialmente la calidad de atencin que reciben los
pacientes. En un estudio sobre el tiempo de espera para ser atendidos se ha registrado la
siguiente informacin:
a) Cul es el tiempo de espera ms habitual?
b) Hay diferencia entre el tiempo promedio de espera y el
tiempo central del conjunto de datos? c) Calcular las medidas de dispersin.
d) El 65% de los pacientes cuanto esperan como mnimo
para ser atendidos?
e) Cul es la espera mxima del 80% de los pacientes?
f) Calcular la amplitud intercuartil e interpretar.
g) Es simtrica la distribucin?
13- Para realizar un estudio de mercado sobre determinado producto se consult a una muestra
de 200 personas de distintas edades, los siguientes box-plots se construyeron teniendo en
cuenta la edad y el sexo de las personas que resultaron satisfechas con el producto.
Analizarlos y extraer conclusiones.
Tiempo (min.) Pacientes
0-5 12
5-10 19
10-15 28
15-20 36
20-25 25
25-30 17
30-35 14
35-40 9
Universidad Nacional de La Matanza Estadstica
-19-
14- Analizar cada uno de los siguientes box-plots teniendo en cuenta:
a) la simetra de la distribucin que representan,
b) la distribucin de los porcentajes de datos,
c) la existencia de valores raros,
d) el rango de la distribucin y la ubicacin de las vallas.
A comienzos del siglo XIX el astrnomo Adolfo Quetelet considerado el fundador de la estadstica moderna- aplic a las ciencias sociales los mtodos estadsticos hasta entonces
E
D
A
D
Universidad Nacional de La Matanza Estadstica
-20-
utilizados en las ciencias naturales, contribuyendo a la ampliacin del campo de la
estadstica.
A partir de mediados de 1960, con el Anlisis Exploratorio de Datos (EDA), desarrollado por
J. Tukey y otros, surgi un nuevo enfoque en el tratamiento de datos cimentado en el uso de
la informtica donde el soporte tecnolgico permiti sostener una gran masa de datos y
procesarlos en tiempo real, contribuyendo as al mejoramiento de la calidad de la informacin
resultante.
El EDA condujo adems a la aparicin de productos grficos tales como el diagrama de caja y
bigotes, entre otros.
15- Con la finalidad de analizar la permanencia de empleados en los puestos de trabajo, se
estudiaron tres empresas similares por la importancia y cantidad de aos de actividad en el
mercado. El estudio consisti en consultar a todos los empleados de dichas empresas sobre la
antigedad que posean en la misma, los resultados se volcaron en los siguientes box-plots.
Analizar los box-plots y extraer conclusiones.
16- Con respecto al ejercicio 7 de la P1.
a) Cuntos prstamos otorgaron como mximo el 65% de las entidades financieras?
b) Cuntos prstamos otorgaron como mnimo el 75% de las entidades financieras?
c) Cuntas entidades otorgaron como mnimo 12 prstamos?
d) Cuntas entidades otorgaron menos de 10 prstamos?
e) A partir del arreglo de datos ordenados del tem a),
i) Determinar los cuartiles y el promedio de la cantidad de prstamos otorgados.
ii) Analizar simetra.
iii) Graficar e interpretar el box-plot.
17- Utilizando los datos y los grficos confeccionados en el ejercicio 10 de la P1.
a) Analizar los grficos y extraer por lo menos tres conclusiones.
b) Hallar la razn entre los empleados que tienen un salario diario superior a $32 y los que
tienen un salario diario inferior a dicho valor.
c) Calcular la media y el desvo estndar.
d) Calcular e interpretar la proporcin de obreros cuyo salario diario:
i) es inferior a 35,04$
ii) es superior a 37,64$
iii) se encuentra entre 35,04 y 37,64$
E1 E2 E3 Empresa
An
tig
ed
ad
en
a
os
Universidad Nacional de La Matanza Estadstica
-21-
e) Determinar los tres cuartiles e interpretarlos.
f) Cmo mximo, cul es el salario diario del 50% de los obreros?.
g) Cmo mnimo, cul es el salario diario del 90% de los obreros?.
18- A partir de los datos ordenados de menor a mayor en el ej. 12 de la P1.
a) Calcular:
i) el gasto medio por consumo semanal de alimentos per cpita y el desvo estndar.
ii) el gasto predominante entre las 100 familias encuestadas.
iii) el gasto mnimo del 50% central de las familias.
iv) Es simtrica la distribucin? Existe alguna relacin entre la simetra y la ubicacin de
las medidas de tendencia central (Mo; Me y x )?
b) Calcular las medidas calculadas en a) utilizando el agrupamiento de los datos en 12
intervalos.
c) Comparar y explicar las diferencias de los resultados obtenidos en a) y en b)
19- Una compaa est considerando la conveniencia de implantar dos programas de
capacitacin para sus empleados. Se seleccionaron dos grupos y a ambos se les imparti
capacitacin para realizar la misma tarea. En el grupo de trabajadores en que se implement el
programa A se requirieron en promedio 32,11 horas para capacitar a cada empleado, con una
varianza de 68,09h2. En el grupo en donde se llev a cabo el programa B se necesit un
promedio de 19,75 horas para capacitar a cada empleado, con una varianza de 71,14h2. Cul
programa result menos heterogneo en sus resultados?.
20- En una empresa se estudiaron los ingresos anuales de los ejecutivos y el de los empleados no
calificados. Los resultados indicaron que el ingreso anual medio de los ejecutivos es de
$86.000 con un desvo de $5.000 y el ingreso anual medio de los empleados no calificados es
de $7200 con un desvo de $200. Existe mayor consistencia en los sueldos de los
trabajadores no calificados? Justificar la respuesta.
21- Se analizan dos comisiones de estudiantes que rindieron el mismo examen de Historia donde
aparecan 12 preguntas y para aprobar se requeran al menos 6 correctas. En cada caso la
cantidad de respuestas correctas observadas fueron:
Curso A 4 7 5 6 8 3 11 7 6 2 6 7 10 6 5 3 6 1 8
Curso B 5 8 9 5 4 9 12 4 4 3 6 5 8 5 7 6 7 3 9
a) Para cada curso obtener el arreglo ordenado de datos.
b) Calcular para cada curso las tres medidas de posicin, comparar e interpretar.
c) Calcular la proporcin de aprobados en cada curso y comparar relativamente la cantidad de
aprobados de ambos cursos.
d) Comparar la homogeneidad de ambos conjuntos de datos.
e) Obtener el box-plot en cada caso y extraer conclusiones.
f) Qu porcentaje de alumnos aprobados contestaron ms de 7 preguntas correctamente?
22- Para la muestra de 200 arandelas del ejercicio 13 de la P1:
a) Calcular la media y el desvo estndar.
b) Calcular e interpretar la proporcin de arandelas cuyo dimetro:
i) es inferior a la media y ii) es superior a 1,50 cm
Universidad Nacional de La Matanza Estadstica
-22-
c) Determinar los tres cuartiles e interpretarlos.
d) Determinar libremente un fractil e interpretarlo.
23- En relacin al ejercicio 15 de la P1, determinar.
a) Cuntas PyMEs de las encuestadas tienen un endeudamiento de a lo sumo bajo?
b) Qu nivel de endeudamiento tienen como mximo la mitad de las PyMEs?
c) Qu porcentaje de esas empresas tienen un endeudamiento superior a Medio?
d) Cul es el rubro que predomina en la muestra?
e) Por cada PyME agrcola, cuntas PyMEs industriales hay en la muestra?
f) Determinar la cantidad de personal predominante en las PyMEs.
g) Calcular la cantidad media de empleados.
h) Determinar la cantidad mediana de empleados e interpretarla.
i) Analizar el tipo de asimetra de la distribucin de la cantidad de personal de las PyMEs.
j) Graficar un box-plot e identificar si en alguna PyME la cantidad de personal es atpica.
k) Determinar para qu variable (considerando antigedad y cantidad de personal) la muestra
es ms heterognea.
24- Analizar si las siguientes afirmaciones son verdaderas siempre-a veces-nunca. Justificar
a) Un conjunto de datos muy asimtrico queda bien representado por una medida como la
media aritmtica.
b) La mediana es la medida ms adecuada de posicin de un conjunto de datos.
c) La varianza tiene como principal aplicacin cuantificar la dispersin absoluta de los datos
respecto a la media.
d) El desvo puede interpretarse ms adecuadamente en el contexto de un problema o
situacin por trabajar en las mismas unidades que la variable.
e) El coeficiente de variacin permite decidir si una distribucin es o no homognea.
f) Si en un box-plot la mediana est ubicada en el centro de la caja eso es equivalente a que la
distribucin es simtrica.
Pautas a considerar
Cualquier resumen estadstico, como las medidas descriptivas o indicadores, se refiere a todo el
conjunto de datos y no a alguno de los individuos en particular.
Si el conjunto de datos constituye una poblacin entonces los indicadores sern poblacionales y
se los denomina parmetros. Si es una muestra entonces sern indicadores muestrales y se
denominan estadsticos.
Con respecto a las medidas se puede decir que:
La media o promedio slo es aplicable a las variables cuantitativas porque se determina, calculndola, en el espacio de los nmeros reales.
Todo grupo de datos ordenables tiene mediana, dado que ella se determina en el espacio de los datos ordenados.
La moda puede determinarse para cualquier tipo de variable, cualitativa o cuantitativa, dado que ella se define en el espacio de los valores o categoras.
Universidad Nacional de La Matanza Estadstica
-23-
Las medidas de intensidad son aplicables a cualquier tipo de variable, cuantitativa o cualitativas dado que su espacio de definicin es el espacio de las frecuencias. Pueden
expresarse indistintamente como coeficientes o como porcentajes.
El agrupamiento de los datos en forma de intervalos de clase permite construir el histograma y
tener una nocin de conjunto del grupo de datos y en algunos casos resolver la deteccin de la
moda. No es conveniente su uso para el clculo del resto de las medidas: media, mediana,
percentiles, varianza, etc. porque virtualmente los datos se matan al ubicarlos en los intervalos y eso en estadstica debe considerarse como deterioro de la informacin. De ser
necesario calcularlas utilizando el agrupamiento en intervalos hay que tener presente que esas
medidas sern de menor calidad que las que se podran calcular si se contara con los datos originales.
Glosario.
Moda o modo: es el valor de la variable que tiene mayor frecuencia.
Mediana: es el lugar geomtrico del espacio de los datos ordenados que lo divide en dos partes
iguales, representando cada una de ellas hasta el 50% de los datos.
Percentil k: es el lugar geomtrico del espacio de los datos ordenados, que deja por debajo el k%
de los datos.
Datos centrales: son el 50% del total y ocupan la zona central de una distribucin (la caja del
box-plot).
Datos adyacentes: son los que se encuentran en las inmediaciones de la caja, por fuera de ella y
a ambos lados hasta una distancia de 1,5(Q3 -Q1).
Datos externos (outliers moderados): son los que se localizan a un distancia de entre 1,5(Q3 -
Q1) y 3(Q3- Q1) a ambos lados de la caja.
Datos lejanos (outliers severos): son los que se encuentran ms all de 3(Q3- Q1) de la caja.
Marca de clase: punto medio del intervalo de clase.
Lmite inferior: es el valor numrico ms bajo de un intervalo de clase.
Lmite superior: es el valor numrico ms alto de un intervalo de clase.
Proporcin: mide cunto incide un valor o grupo de valores de la variable en el total.
Razn: compara un valor o grupo de valores, contra otro valor o grupo de valores.
Rango recorrido de una distribucin: diferencia entre el valor mximo y el valor mnimo de
una variable cuantitativa. Mide la dispersin de la distribucin sin tomar en cuenta los valores
intermedios.
Rango intercuartlico: diferencia entre el cuartil 3 y el cuartil 1. Mide la dispersin de la parte
central de la distribucin sin tomar en cuenta los valores de los datos que caen dentro de la caja.
Desvo: diferencia entre el valor de un dato y la media de toda la distribucin.
Varianza: promedio del cuadrado de los desvos. Mide la dispersin de una distribucin
teniendo en cuenta todos los datos. Su magnitud es el cuadrado de la magnitud de la variable.
Desvo estndar: es la raz cuadrada de la varianza. Su magnitud es igual a la de la variable. En
distribuciones simtricas describe un entorno alrededor de la media que encierra las 2/3 partes de
todos los datos.
Coeficiente de variacin: es la relacin entre el desvo estndar y la media. Mide dispersin
relativa. Es un coeficiente adimensional y sirve sobre todo para comparar, dentro de un mismo
grupo de unidades de observacin, la dispersin de variables que tienen distinta magnitud.
Universidad Nacional de La Matanza Estadstica
-24-
PRCTICA 3
NMEROS NDICES
El nmero ndice es una medida de intensidad y el objetivo de su clculo es el de
encontrar indicadores que pongan de manifiesto, en forma cuantitativa y abreviada, las
variaciones relativas de los valores que adopta un fenmeno en dos o ms circunstancias
distintas en el tiempo o en el espacio (en su acepcin ms amplia).
1- La siguiente informacin referida al comercio exterior de Argentina fue publicada el domingo
2 de marzo de 2003, en la seccin econmica del diario Clarn.
El vuelco del comercio exterior Qu compramos y a quin en los ltimos dos aos
EXPORTACIONES IMPORTACIONES SALDO COMERCIAL
Analizar la informacin y extraer conclusiones.
2- En la siguiente tabla aparecen valores vinculados a la actividad ganadera en nuestro pas
publicados por el Indec (Ver en http://www.indec.mecon.ar/nuevaweb/cuadros/11/f050201.xls)
Faena, exportacin y consumo de carne vacuna, porcina y ovina. Total del pas. Aos 2008-2012
Ganado 2008 2009 2010 2011 2012
Faena (en Cabezas)
Vacunos 14.660.284 16.052.188 11.872.423 10.865.019 11.428.791
Porcinos 3.153.829 3.339.759 3.234.133 3.442.760 3.818.758
Ovinos 1.076.475 1.144.811 1.055.585 906.201 769.166
Ovinos 4.140.288 4.403.119 4.059.942 3.485.388 2.958.331
Exportacin (en Toneladas)
Vacunos 429.360 661.378 309.874 250.893 183.817
Porcinos 1.343 885 706 839 926
Ovinos 9.912 8.935 8.524 6.055 3.341
Consumo (en Miles de toneladas)
Vacunos 2.703 2.715 2.306 2.246 2.412
Porcinos 305 319 326 350 355
Ovinos 67 74 66 60 56
Nota: el consumo incluye el volumen importado.
Fuente: Ministerio de Agricultura, Ganadera y Pesca. Direccin Nacional de Estudios Econmico del Sector Agropecuario en base a datos
propios y SENASA
En millones de U$S
20.321
8.988
2001 2002
-56%
En millones de U$S
6.289
16.358
2001 2002
+160%
En millones de U$S
26.61025.346
2001 2002
{-5%
Universidad Nacional de La Matanza Estadstica
-25-
a) Para cada tipo de ganado calcular, en cada categora seleccionada, los relativos simples de
cada ao respecto al anterior e interpretar los resultados de las variaciones porcentuales
obtenidas.
b) Para cada categora (faena, exportacin y consumo) calcular el ndice compuesto de
agregados no ponderados: i) del ao 2012 respecto al ao 2010 y ii) del ao 2012 respecto
al 2008. Interpretar los resultados obtenidos.
c) Para cada categora (faena, exportacin y consumo) calcular el ndice compuesto a partir
del promedio de relativos simples: i) del ao 2012 respecto al ao 2010 y ii) del ao 2012
respecto al 2008. Interpretar los resultados obtenidos.
d) Comparar los resultados obtenidos en b) y c).
3- Un gran fabricante europeo de automviles recopil la siguiente informacin sobre las ventas
de automviles logradas por una empresa estadounidense:
Precio anual promedio (miles) Unidades vendidas (x 1000)
Tamao/ ao 1999 2000 2001 1999 2000 2001
Subcompacto 31 34 35 32 65 86
Compacto 38 39 40 45 68 73
Sedan 45 49 53 462 325 386
Calcular los ndices de Paasche, Laspeyres y Fisher para 2001 usando como perodo base
1999. Compararlos.
4- Dados los datos resumidos en la taba siguiente que corresponden a ndices mensuales respecto
al mes inmediatamente anterior, calcular el ndice de Fisher para los perodos consignados
(Base Enero 2006 =100):
Perodo ndice de Laspeyres ndice de Paasche ndice Fisher
Marzo 2006 107,6 109,2
Abril 2006 103,8 105,4
Mayo 2006 101,9 103,1
Junio 2006 102,8 105,3
5- El ndice de precios al consumidor y el promedio del salario de la empleada domstica y el
maestro de grado para los aos 2007 al 2011 fueron:
Ao IPC*
(Base abril
2008 = 100)
Empleada domstica
(Salario por hora
en $)**
Maestro de grado jornada simple.
(Piso salarial mensual promedio
en $. Prov. Bs. As.)**
2007
2008
2009
2010
2011
93,08
101,07
107,41
118,65
130,35
4,65
6,90
8,70
10,27
12,63
1040
1290
1500
1790
2200
*Datos tomados de http://www.indec.gov.ar/principal.asp?id_tema=748. ** Datos reales
Dado que el salario real ajustado es el cociente entre el salario neto y el ndice de precios al
consumidor,
i) analizar los salarios reales ajustados de las empleadas domsticas y los maestros de grado
para todos los aos dados.
Universidad Nacional de La Matanza Estadstica
-26-
ii) calcular las variaciones porcentuales de los salarios reales de cada ao respecto al
anterior.
6- A continuacin se muestran el Balance General y el Estado de Resultado de una empresa para
los aos 2010 a 2013
a) Con los datos del Balance General
i) Calcular para el "pasivo corriente" los montos relativos del Balance General al
30/06/2013 utilizando como base el Balance General al 30/06/2010.
ii) Determinar los ndices Compuestos no ponderados de los 4 rubros que componen el
"activo corriente" para cada ao tomando como base el activo corriente del Balance
General al 30/06/2010.
iii) dem al punto b) calculando el promedio de relativos simples.
b) Con los datos del Estado de Resultado calcular un ndice simple y uno compuesto.
RAZON SOCIAL: Camino a la Excelencia S.A.
DOMICILIO LEGAL: Florencio Varela 1320 - San Justo
ACTIVO 30/06/2010 30/06/2011 30/06/2012 30/06/2013
ACTIVO CORRIENTE
Caja y bancos 75.267,55 89.856,77 76.597,31 85.326,69
Deudores por Ventas 64.597,56 77.591,80 75.412,69 70.767,76
Otros Crditos 7.781,02 8.864,50 9.765,41 10.417,23
Bienes de Cambio 21.687,95 20.790,84 29.657,79 38.223,89
Total del activo corriente 169.334,08 197.103,91 191.433,20 204.735,57
ACTIVO NO CORRIENTE
Bienes de Uso 5.057,63 4.551,87 4.366,68 3.930,01
Total del activo no corriente 5.057,63 4.551,87 4.366,68 3.930,01
Total del activo 174.391,71 201.655,78 195.799,88 208.665,58
PASIVO
PASIVO CORRIENTE
Cuentas por Pagar 24.761,48 24.567,98 27.468,65 32.989,37
Remuneraciones y Cargas Sociales 2.009,87 2.257,91 2.759,87 3.536,63
Cargas Fiscales 1.408,37 1.670,01 1.579,84 1.751,20
Otras Deudas 2.914,87 3.102,59 4.012,88 5.991,68
Total del pasivo corriente 31.094,59 31.598,49 35.821,24 44.268,88
PASIVO NO CORRIENTE
Otras Deudas 1.210,85 2.603,83 1.546,00 523,47
Total del pasivo no corriente 1.210,85 2.603,83 1.546,00 523,47
TOTAL DEL PASIVO 32.305,44 34.202,32 37.367,24 44.792,35
PATRIMONIO NETO
Segn Estado Respectivo 142.086,27 167.453,46 158.432,64 163.873,23
TOTAL DEL PATRIMONIO NETO 142.086,27 167.453,46 158.432,64 163.873,23
TOTAL PASIVO + PATRIMONIO NETO 174.391,71 201.655,78 195.799,88 208.665,58
BALANCE GENERAL
Universidad Nacional de La Matanza Estadstica
-27-
7- Ejercicio Integrador:
En base al artculo sobre el ndice del Costo de la Construccin en el Gran Buenos Aires, con fecha 13 de febrero de 2014, que se encuentra en la siguiente pgina http://www.indec.mecon.ar/nuevaweb/cuadros/10/icc_02_14.pdf
a) Con la informacin de la tabla 1: ndice del Nivel general y Captulos i) verificar las variaciones % de enero 2014 respecto al mes anterior calculndolas con los
ndices correspondientes.
ii) A partir de las variaciones % de enero 2014 respecto a enero 2013, obtener los ndices
simples correspondientes a enero 2013 respecto a 1993 en las cuatro categoras.
iii) Para enero del 2014 y diciembre del 2013, calcular el promedio no ponderado de los
ndices (relativos simples) correspondientes a materiales, mano de obra y gastos
generales. Comparar lo obtenido con el ndice para nivel general en ambos perodos.
b) Con la informacin de la tabla 2: ndices por tem de obra, tanto para enero de 2014 como para diciembre de 2013 calcular el promedio no ponderado de los ndices (relativos
simples) correspondientes a las trece categoras. Comparar lo obtenido para cada perodo
con los ndices de mano de obra de la tabla 1.
c) Con la informacin de la tabla 5: Costo por m2 de la vivienda multifamiliar y variaciones porcentuales. Verificar e interpretar las variaciones % de: i) Diciembre de 2009 respecto a Diciembre del ao anterior.
ii) Mayo de 2012 respecto al mes anterior.
iii) Junio de 2013 respecto al mes anterior y respecto al mismo mes del ao anterior.
d) Con la informacin de la tabla 6: Costo por m2 de la vivienda unifamiliar y variaciones porcentuales. i) Utilizando los costos mensuales, calcular el ndice de agregados no ponderados del ao
2013 respecto al ao 2012.
RAZON SOCIAL: Camino a la Excelencia S.A.
DOMICILIO LEGAL: Florencio Varela 1320 - San Justo
ESTADO DE RESULTADO
30/06/2010 30/06/2011 30/06/2012 30/06/2013
Ventas 587.945,80 651.497,86 687.421,89 751.245,35
Costo de Mercaderias Vendidas 344.894,78- 397.631,84- 411.830,48- 461.466,35-
Ganancia Bruta 243.051,02 253.866,02 275.591,41 289.779,00
Gastos de Admistracin 39.791,28- 43.791,84- 47.976,54- 50.022,64-
Gastos de Comercializacn 98.083,64- 104.887,64- 117.643,91- 123.813,17-
Gastos Financieros 3.917,68- 4.297,67- 6.904,57- 7.655,39-
Otros Ingresos - 1.200,00 2.396,91 -
Resultado del Ejercicio 101.258,42 102.088,87 105.463,30 108.287,80
Universidad Nacional de La Matanza Estadstica
-28-
ii) Utilizando los costos mensuales, calcular el promedio de relativos simples mensuales de
ao 2013 respecto al ao 2012.
iii) Interpretar y comparar los resultados obtenidos en i) y ii)
e) Utilizando la informacin de la Sntesis Metodolgica sobre el ndice de Laspeyres y el tipo
de ponderaciones empleada, verificar que:
i) el ndice ponderado por captulo as construido se corresponde con la variacin
porcentual del nivel general en enero 2014 respecto al mes anterior (tabla 1)
ii) el ndice ponderado por tem de obra as construido se corresponde con la variacin
porcentual de mano obra de enero 2014 respecto al mes anterior (tabla 1, con mano de
obra desagregada en tabla 2)
Pautas a considerar
Si bien cada medida de posicin es nica para un mismo conjunto de datos, es el fenmeno en
estudio el que debe incidir en la decisin de elegir cul o cules son las ms indicadas u ptimas
para representarlo. Para las medidas de intensidad, en particular para los nmeros ndices, no
slo incide el fenmeno sino que adems la propiedad de unicidad no se cumple.
Todo esto indica que la eleccin de una medida en el marco de un problema de estudio est
influenciada por subjetividades, hecho que conlleva el riesgo de manipulacin estadstica y/o la
mala informacin, ya descripto en el texto de la pgina 16.
Glosario
Indice simple: compara un valor consigo mismo, en dos momentos distintos en el tiempo o en
dos situaciones distintas en el espacio (en un sentido amplio).
Indice compuesto: compara un grupo de valores con respecto a si mismo, en dos momentos
distintos en el tiempo o en dos situaciones distintas en el espacio. Media de relativos simples (de precios, cantidades o valores): es un ndice compuesto y resulta de
promediar los relativos simples de cada valor.
ndice de agregados no ponderados: es un ndice compuesto que resulta del cociente entre las sumas o
agregaciones (de precios o cantidades) correspondientes a las dos situaciones distintas. ndice de agregados ponderados: es un ndice compuesto de precios que resulta del cociente entre las
sumas o agregaciones de precios -ponderados con cantidades- correspondientes a las dos situaciones
distintas. Segn el criterio de ponderacin se califican en ndice de Laspeyres, de Paasche, de Fisher, etc..
Indice deflactor: es cualquier ndice general de precios (IPC, IPIM, ICC) usado para corregir el valor
monetario de una magnitud econmica, lo que permite efectuar comparaciones a lo largo del tiempo (por
ejemplo el salario).
IPC: ndice de precios al consumidor. Se usa para analizar la evolucin del costo de vida.
IPIM: ndice de precios industriales mayoristas. En realidad es un sistema de varios ndices (SIPIM).
ICC: ndice de costos de la construccin. En rigor no es un ndice de precios sino de costos.
Universidad Nacional de La Matanza Estadstica
-29-
PRCTICA 4
SERIES DE TIEMPO
Si al observar una variable estadstica hay razones para pensar que los valores de sta
estn influenciados por los momentos de tiempo en que se los observa -y es lo que
caracteriza al fenmeno estudiado estadsticamente- no sirve el enfoque de frecuencias,
se hace necesario utilizar otro tipo de enfoque que consiste en observar cada valor de la
variable en relacin al transcurso del tiempo (ya no su repeticin, ya no su frecuencia).
Este otro enfoque produce que los datos relevados queden organizados en una
distribucin que se denomina Serie de Tiempo.
1- Un analista necesita establecer un modelo que le permita estimar los montos correspondientes
a importaciones mensuales de insumos para determinado rubro industrial, a partir de la
informacin registrada en la tabla y el grfico correspondiente, en millones de dlares.
a) Determinar la recta de tendencia y trazarla en el grfico. b) Filtrar la serie por tendencia, graficar los valores obtenidos y observar si presenta
componente peridica. Justificar.
c) Analizar, en ambos casos, los residuos relativos y determinar en qu ao se produjo la mxima fluctuacin.
d) Estimar los montos requeridos para importaciones de los meses de marzo, julio y diciembre de 2012.
En las series de tiempo es la variable estadstica la que est en funcin del tiempo, por lo
que se la representa en el eje de ordenadas.
2- Los datos de la tabla corresponden a diferentes aos y cuatrimestres para cierta variable de
inters.
800
900
1000
1100
1200
1300
1400
1500
1600
1700
1800
1900
2000
2100
2200Mes 2010 2011
Enero 1039 1578
Febrero 898 1487
Marzo 1323 1850
Abril 1207 1760
Mayo 1253 1741
Junio 1410 1836
Julio 1559 1776
Agosto 1538 2103
Septiembre 1563 1766
Octubre 1570 1841
Noviembre 1758 1904
Diciembre 1666 1970
Universidad Nacional de La Matanza Estadstica
-30-
Cuatrimestres 2001 2002 2003 2004
1 20 30 10 30
2 10 20 30 20
3 10 10 20 30
a) Estudiar si presenta una componente estacional.
b) Obtener la tendencia lineal para la serie original.
c) Pronosticar la variable para el segundo y tercer trimestre de 2005.
3- Las ventas de una empresa, que se inician en 1993, se muestran en el siguiente diagrama.
g) Calcular y graficar los residuos no peridicos.
h) Pronosticar las ventas para 2001 y 2002.
4- El resumen que sigue fue publicado por la Comisin Econmica para Amrica Latina y el
Caribe (CEPAL) en un informe sobre Progreso Tcnico y cambio estructural en Amrica
Latina en 2007. (Ver en http://www.eclac.cl/iyd/noticias/paginas/4/31434/progresot%C3%A9cnicocambioestructural.pdf)
a) A partir de esta informacin determinar las tendencias lineales para cada regin
interpretando y comparando sus pendientes. Trabajar por dcadas y por aos.
b) Para cada una de las regiones calcular los residuos relativos y determinar en qu perodo se
produjo la mxima fluctuacin. Comparar los resultados obtenidos.
a) Reconstruir a partir del grfico la tabla de
datos.
b) Estimar la ecuacin de la tendencia para la
serie de ventas.
c) Calcular y graficar los residuos relativos
entre los valores estimados y los
observados.
d) Dnde se presenta la mayor variacin?
e) Verificar si existe alguna componente
cclica peridica y establecer su longitud.
f) Calcular los correspondientes ndices
cclicos para cada fraccin del ciclo en la
que se tienen datos.
Universidad Nacional de La Matanza Estadstica
-31-
c) Estimar los montos de las importaciones y de las exportaciones para el ao 2000.
5- Si los ndices de variacin estacional en los tres primeros meses del ao son 1,02; 0,90 y 1,05
y la ecuacin de la tendencia secular de una serie histrica compuesta por datos
correspondientes a 10 aos es T(t) = 378 + 12 t, pronosticar la variable en estudio para el
primer mes de cada uno de los dos aos posteriores a los que se procesaron en la serie dada.
6- La tabla siguiente muestra para algunos pases seleccionados de Amrica Latina la Proporcin
renovable de la oferta energtica (en porcentajes) tomada de la seccin Bases de datos y
Publicaciones Estadsticas CEPALSTAT realizadas por expertos de la CEPAL. (Ver en http://interwp.cepal.org/sisgen/ConsultaIntegradaFlashProc.asp)
Pases Argentina Bolivia Brasil Chile Ecuador Mxico Paraguay Per Uruguay Venezuela
1990 8.4 35.9 41.7 22.2 21.2 8.3 70.0 34.4 42.2 8.5 1991 7.9 37.1 41.7 25.6 21.1 8.0 70.4 35.1 38.5 9.7 1992 8.5 34.7 41.2 27.4 19.0 8.2 68.3 33.2 37.7 10.1 1993 9.6 34.6 40.2 26.3 21.1 8.5 65.6 32.8 39.7 10.1 1994 9.8 30.8 40.3 25.0 20.0 7.3 64.4 31.4 43.1 9.5 1995 9.8 28.1 38.7 24.8 18.1 8.3 64.6 29.3 40.4 9.9 1996 8.7 21.1 37.8 23.0 17.4 8.2 63.5 28.4 36.7 9.5
1997 9.2 19.6 38.1 21.8 15.9 7.2 63.6 29.6 34.3 7.7 1998 8.9 18.8 37.2 20.5 17.3 6.8 61.6 28.6 35.4 7.9 1999 7.9 23.0 36.7 18.3 20.0 9.6 62.6 27.3 28.7 8.7 2000 9.0 28.8 35.3 19.2 16.8 9.2 66.4 28.8 33.9 9.4 2001 10.9 31.0 34.8 21.1 16.0 8.7 67.7 31.2 40.2 10.1 2002 10.8 26.3 36.4 20.9 16.9 8.6 64.3 31.4 43.6 10.5 2003 9.9 26.7 39.4 20.0 15.2 8.2 64.1 33.2 42.1 9.5 2004 8.6 27.0 39.1 19.2 13.7 8.4 66.4 30.5 35.0 11.1 2005 9.3 24.7 40.0 20.2 12.9 8.7 68.9 28.2 36.3 11.0
2006 8.4 22.2 40.6 21.0 11.2 8.3 67.7 31.2 32.2 7.5
2007 7.3 27.1 42.4 18.8 11.9 8.1 67.5 29.7 38.2 7.9 2008 8.7 27.3 42.3 19.1 12.8 8.2 65.8 26.3 35.0 7.5 2009 9.4 27.3 43.6 20.2 10.6 7.6 64.3 28.8 39.0 7.3 2010 10.1 23.2 42.2 18.4 9.8 8.0 65.6 24.3 47.4 6.1 2011 9.8 24.1 40.6 17.6 11.4 7.9 65.6 24.0 42.4 11.3
a) Obtener y comparar las tendencias de Argentina, Brasil, Venezuela y Mxico.
b) Analizar si existe componente peridica en alguna de ellas.
c) En caso de reconocerla, modelarla obteniendo los ndices cclicos.
d) Estimar las proporciones aproximadas de este ao utilizando los ndices obtenido en caso
de ser necesario.
7- Una fbrica de juguetes hace inventario de sus muecos, autos, barcos y otros productos
disponibles cada trimestre, en miles de unidades. Los datos de cada trimestre a partir de 2002
se indican en la tabla y grfico siguientes:
Universidad Nacional de La Matanza Estadstica
-32-
Trimestre
Ao I II III IV 2002
2003
2004
2005
2006
2007
8,3
8,0
9,1
8,8
10,0
11,4
6,3
6,1
5,7
6,8
6,6
6,0
12,5
12,0
11,7
12,1
12,8
13,6
14,9
15,2
15,7
18,0
17,5
16,8
A partir de la recta de tendencia que figura en el diagrama:
a) Interpretar la pendiente y la ordenada al origen.
b) Calcular los porcentajes de la tendencia y analizar los residuos.
c) Verificar la presencia de ciclos peridicos anuales.
d) Calcular los correspondientes ndices cclicos para cada fraccin del ciclo en la que se
tienen datos.
e) Observar si se observa alguna componente de mayor longitud. Elaborar algn comentario.
f) Con los ndices calculados obtener los residuos no peridicos.
g) Proyectar los inventarios para el primer trimestre del 2009 y el cuarto trimestre del 2013.
8- a) Desestacionalizar la siguiente serie histrica segn las estaciones del ao, siendo los ndices
estacionales los que acompaan a la serie dada:
b) Obtener la ecuacin de la tendencia para la serie original y para la serie desestacionalizada
y comparar.
c) Pronosticar la variable en estudio para la primavera y el verano de 2011.
9- Entre los datos publicados por el INDEC aparece la siguiente informacin, referida a
volmenes de Inversin Bruta Interna Fija, a valores trimestrales en millones de pesos, a
precios corrientes. (Ver en http://www.indec.mecon.ar/principal.asp?id_tema=783)
Ao 2006 2007 2008 2009 ndice Estacional
Primavera 8 7 9 10 1,02
Verano 10 11 12 13 1,20
Otoo 9 8 9 10 1,10
Invierno 5 4 6 5 0,68
Universidad Nacional de La Matanza Estadstica
-33-
Perodo Inversin Bruta Interna Fija
A
o
Tri
m
To
tal
Co
nst
rucc
in
Equipo Durable
Eq
uip
o
Du
rab
le
Eq
. D
ura
ble
Na
cio
na
l
Eq
. D
ura
ble
Imp
ort
ad
o
Ma
qu
ina
ria
y E
qu
ipo
Na
cio
na
l (1
)
Imp
ort
ad
o
Ma
teria
l d
e
Tra
nsp
ort
e
Na
cio
na
l
Imp
ort
ad
o
2004 II 82.186 50.542 31.644 15.071 16.573 22.157 10.868 11.289 9.488 4.204 5.284
III 89.813 52.326 37.486 15.816 21.670 25.829 11.643 14.187 11.657 4.173 7.484
IV 99.337 56.928 42.409 19.369 23.040 30.261 14.248 16.013 12.148 5.121 7.027
2005 I 88.857 53.892 34.965 14.273 20.692 24.275 9.942 14.333 10.690 4.331 6.359
II 112.162 68.243 43.919 18.443 25.477 27.882 12.837 15.045 16.037 5.606 10.432
III 118.355 72.010 46.345 19.370 26.974 32.225 13.629 18.595 14.120 5.741 8.379
IV 137.156 81.662 55.494 25.265 30.229 36.420 17.409 19.011 19.074 7.856 11.218
2006 I 122.263 75.508 46.755 18.279 28.476 31.301 11.979 19.322 15.454 6.300 9.154
II 150.853 98.511 52.342 22.353 29.988 34.835 15.453 19.382 17.506 6.900 10.606
III 165.464 103.200 62.265 24.193 38.071 40.901 16.850 24.051 21.364 7.343 14.021
IV 172.770 106.873 65.897 31.439 34.458 44.498 21.696 22.802 21.399 9.744 11.655
2007 I 156.034 95.985 60.049 22.349 37.700 39.620 14.692 24.928 20.428 7.656 12.772
II 186.946 122.450 64.496 26.845 37.651 43.874 18.497 25.377 20.622 8.348 12.275
III 212.072 130.209 81.863 29.490 52.373 54.694 20.302 34.392 27.169 9.188 17.980
IV 231.437 142.390 89.047 39.989 49.058 58.111 26.974 31.138 30.935 13.014 17.921
2008 I 213.774 125.831 87.943 29.328 58.615 54.005 19.389 34.616 33.938 9.939 23.999
II 240.132 156.914 83.218 31.528 51.690 54.520 20.165 34.355 28.698 11.363 17.335
III 255.835 157.557 98.278 37.179 61.099 65.196 25.174 40.022 33.082 12.005 21.077
IV 252.202 160.726 91.476 41.048 50.428 60.145 29.477 30.667 31.330 11.572 19.761
2009 I 207.355 137.329 70.027 32.343 37.684 51.519 23.165 28.355 18.507 9.178 9.329
II 238.400 162.079 76.321 35.558 40.764 52.452 27.150 25.302 23.869 8.408 15.461
III 249.656 157.207 92.449 41.041 51.408 64.221 29.902 34.319 28.228 11.139 17.089
IV 263.137 171.301 91.836 42.783 49.053 58.392 28.562 29.831 33.443 14.221 19.222
2010 I 255.429 158.810 96.620 38.310 58.309 58.929 26.632 32.297 37.687 11.675 26.012
II 309.885 199.640 110.246 45.631 64.615 70.858 31.243 39.615 39.387 14.388 24.999
III 342.733 194.502 148.232 59.735 88.497 98.989 42.906 56.083 49.242 16.829 32.414
IV 361.618 220.283 141.336 59.115 82.221 90.151 37.103 53.049 51.184 22.012 29.172
2011 I 337.661 201.979 135.682 53.125 82.557 94.729 37.196 57.533 40.953 15.929 25.024
II 416.370 251.073 165.298 62.324 102.974 105.456 43.078 62.378 59.841 19.245 40.596
III 454.038 244.586 209.452 85.277 124.175 142.742 61.239 81.503 66.710 24.038 42.672
IV 455.276 268.451 186.825 87.003 99.822 113.953 50.215 63.738 72.872 36.788 36.084
2012 I 408.049 242.476 165.573 71.919 93.654 114.158 51.339 62.820 51.415 20.581 30.834
II 445.771 290.090 155.681 75.782 79.899 110.053 55.462 54.591 45.628 20.321 25.308
III 510.784 279.230 231.554 105.987 125.568 161.418 77.085 84.333 70.136 28.902 41.234
IV 520.852 306.257 214.595 105.587 109.008 129.698 60.978 68.720 84.897 44.609 40.288
2013 I 473.074 281.145 191.930 92.786 99.144 s.d. 65.967 s.d. s.d. 26.819 s.d.
II 591.928 353.290 238.637 116.941 121.696 s.d. 86.174 s.d. s.d. 30.767 s.d.
III 662.345 346.293 316.052 151.972 164.080 s.d. 112.204 s.d. s.d. 39.768 s.d. Fuente: Direccin Nacional de Cuentas Nacionales. (1).- Incluye elaboracin de Equipo durable de produccin por cuenta propia. s.d.: Sin datos.
a) Utilizando los valores correspondientes a Inversin Bruta Interna Fija en Equipos Durables
nacionales e importados se determinaron las respectivas rectas de tendencia que resultaron:
Universidad Nacional de La Matanza Estadstica
-34-
Equipos Durables Nacionales: TN (t)=2420,73.t-240,47
Equipos Durables Importados: TI (t)=2765,99.t+7049,25
y con los residuales cclicos de cada serie se construyeron los grficos que siguen. Estudiar si
alguna de ellas presenta alguna componente peridica.
b) En caso de presentar periodicidad, modelarla y obtener los ndices estacionales.
c) Pronosticar los montos correspondientes a los cuatro trimestres de 2014.
Pautas a considerar
Mientras que la funcin de los nmeros ndices es la de describir en forma puntual el
comportamiento de uno o algunos valores de una variable en dos situaciones diferentes de
tiempo, la funcin de las series de tiempo es describir en forma grupal el conjunto de todas las
situaciones en anlisis y realizar predicciones .
Glosario
Componentes de una serie de tiempo: partes en las que se desglosa una serie de tiempo para su
anlisis.
Tendencia: componente que modela el comportamiento de la serie a largo plazo.
Componentes cclicas: describen si los hubiere- el comportamiento de los ciclos peridicos de distinta longitud que aparecen en la serie. Es decir que modelan los fenmenos de naturaleza
peridica que inciden en la serie.
Componente estacional: nombre de la componente cclica cuya longitud es de un ao.
Componente irregular: contiene los ciclos no peridicos y el ruido estadstico.
Recta de tendencia: modelo matemtico que describe la tendencia de la serie.
ndices cclicos o coeficientes cclicos: conjunto de valores puntuales que describen el ciclo
modelado. Si la serie tuviera ms de un ciclo peridico, para cada uno de ellos existir un
conjunto de ndices descriptores.
0,6
0,8
1
1,2
1,4
1,6
1,8
1 5 9 13 17 21 25 29 33 37
Eq Dur Nac Eq Dur Imp
Universidad Nacional de La Matanza Estadstica
-35-
PRCTICA 5
CLCULO DE PROBABILIDADES
La teora de la probabilidad es la herramienta conceptual necesaria para abordar con
fundamento los problemas de la estadstica inferencial.
En la inferencia estadstica, las muestras representativas de una poblacin son el
material bsico de trabajo y para poder extraerlas adecuadamente se utilizan los
experimentos aleatorios compuestos p