SOLUCIONES UNIDAD I 1.2 Definición de población, muestra ...
Post on 15-Nov-2021
4 Views
Preview:
Transcript
166
SOLUCIONES
UNIDAD I
EJERCICIOS PROPUESTOS
1.1 Definición de estadística. Tipos de
estadística (descriptiva e inferencial)
1.-
a. Descriptiva
b. Inferencial
c. Descriptiva
d. Inferencial
2.-
a. Descriptiva
b. Probabilidad
c. Descriptiva
d. Probabilidad
e. Descriptiva
f. Descriptiva
g. Probabilidad
h. Descriptiva
3.-
a. Falsa. Porque también estudia
características cuantitativas.
b. Falsa. Porque también le interesan
fenómenos cualitativos.
c. Falsa. Porque también organiza,
tabula, obtiene conclusiones a partir
de ellos.
d. Verdadera.
e. Verdadera.
f. Verdadera.
g. Verdadera.
h. Verdadera.
i. Falsa. Lo planteado corresponde a la
definición de población.
1.2 Definición de población, muestra,
parámetro, estadístico, variable y
datos.
1.-
a. Personas con hipertensión.
b. 5000 personas con hipertensión.
c. La proporción de personas cuya
hipertensión puede ser controlada con
un nuevo medicamento.
d. Personas con hipertensión.
e. Proporción de hipertensos que
pudieron controlar su hipertensión
utilizando el nuevo medicamento.
f. Proporción de 5000 individuos
hipertensos que pudieron controlar su
hipertensión utilizando el nuevo
medicamento. Su valor es 4/5
g. No se conoce, pero se estima a partir
de la muestra obtenida.
2.-
a. Estudiantes de cierta universidad.
b. El costo de todos sus libros
comprados en un semestre.
3.-
a. Población: Total de hinchas chilenos
que asistieron al estadio El
Centenario.
Muestra: 51 de los hinchas que
asistieron al estadio El Centenario.
b. Población: Alumnos que rindieron
PSU.
Muestra: 517 futuros estudiantes de
universidad
167
4.-
a. Costo medio de los libros escolares
por semestre.
b. Costo de los libros escolares.
c. Gasto promedio en libros de texto de
50 estudiantes admitidos.
d. Se utilizarían para predecir los gastos
promedios de libros de texto que hace
la población.
5.-
a. Un población es aquel conjunto de
personas o cosas que se desea
estudia, por ejemplo, se quiere saber
cuántos niños del 5to básico tienen
celular, en este caso el curso
completo es la población y una
muestra seria una parte del curso, no
su totalidad.
b. Se debe tomar en cuenta una muestra
ya que para un estudio muchas veces
la población es demasiado grande y
poco accesible.
6.-
a. Proporción de personas que votaran
por cierto candidato.
b. 1/6 de las personas votará por cierto
candidato.
c. No se puede asegurar si es falsa o
correcta por que se encuesto a una
muestra muy pequeña.
1.3 Clasificación de variables. Escalas
de medición.
1.-
a. Cuantitativa continua.
b. Cuantitativa discreta.
c. Cualitativa ordinal.
d. Cualitativa nominal.
e. Cuantitativa discreta.
f. Cualitativa nominal.
g. Cualitativa nominal.
h. Cuantitativa continua.
i. Cuantitativa discreta.
j. Cuantitativa continua.
k. Cualitativa ordinal.
l. Cualitativa discreta.
m. Cuantitativa discreta.
n. Cualitativa nominal.
o. Cuantitativa continua.
p. Cuantitativa continua.
q. Cuantitativa discreta.
r. Cualitativa nominal.
2.-
a. No es variable.
b. Cuantitativa continua.
c. Cualitativa nominal.
d. Cualitativa nominal
3.-
a. Cualitativa nominal.
b. Cuantitativa discreta.
c. Cuantitativa discreta.
d. Cuantitativa continua.
e. Cuantitativa discreta.
4.1.-
a. Los resultados obtenidos por los
colegios en el SIMCE 2014
corresponde a la variable y la escala
de medición es cuantitativa discreta.
b. El enunciado se refiere a una
muestra.
4.2.-
a. Clubes chilenos.
b. Ingresos de los clubes chilenos
c. Representa el porcentaje de ingresos
de los clubes chilenos por derechos
de trasmisión en CDF.
168
CONTROL DE UNIDAD
a. Descriptiva.
b. Inferencial.
c. Verdadera.
d. Verdadera.
e. Población.
f. Cualitativa.
g. Dato.
h. Cuantitativa.
i. Verdadera.
j. Verdadera.
EJERCICIOS TIPO PRUEBA
1.-
a. Inferencial.
b. Descriptiva.
c. Descriptiva.
d. Inferencial.
e. Descriptiva.
f. Inferencial.
2.-
a. Un dato.
b. ¿Qué es lo que comúnmente compra
en el mercado?
c. ¿Compra artículos que están en su
lista o termina comprando cosas que
no necesita?
3.-
a. Un dato.
b. Número de veces que expresan los
padres afecto a sus hijos en un día.
c. Solución al lector.
4.-
a. ¿Los esquiadores prefieren esquí o
Snowboard?
b. Nivel de profesionalismo de los
esquiadores.
c. Número de esquiadores que se alojan
en el hotel por día.
d. Tiempo de subida a los centros de
esquí.
UNIDAD II
EJERCICIOS PROPUESTOS
2.1 presentación de la información en
tablas de distribución de frecuencias.
1.-
a. 𝑅 = 176 − 119 = 57
𝑁 = 40
𝐾 = 1 + 3,3 log(40) = 6,28 ≈ 6
𝑎 =57
6= 9,5 ≈ 10
Sueldo 𝒙𝒊 𝒏𝒊 𝒇𝒊 𝑵𝒊 𝒇𝒊% 𝑭𝒊% [119-129[ 124 4 0,1 4 10% 10% [129-139[ 134 7 0,175 11 17,5% 27,5% [139-149[ 144 13 0,325 24 32,5% 60% [149-159[ 154 9 0,225 33 22,5% 82,5% [159-169[ 164 5 0,125 38 12,5% 95% [169-179[ 174 2 0,05 40 5% 100%
Total 1,00 100%
b. En la tercera clase se encuentra la
mayor cantidad de trabajadores.
c. Un 67,5% de los trabajadores gana
entre $139.000 y $169.000.
d. 7 trabajadores ganan a lo menos
$159.000
e. 24 trabajadores ganan a lo más
$149.000
169
2.-
a. 𝑅 = 58 − 36 = 22
𝑁 = 30
𝐾 = 1 + 3,3 log(30) = 5,87 ≈ 6
𝑎 =22
6= 3,666 ≈ 4
Peso 𝒙𝒊 𝒏𝒊 𝒇𝒊 𝑵𝒊 𝒇𝒊% 𝑭𝒊% [36-40[ 38 4 0,133 4 13,3% 13,3% [40-44[ 42 7 0,233 11 23,3% 36,6% [44-48[ 46 7 0,233 18 23,3% 59,9% [48-52[ 50 5 0,166 23 16,6% 76,5% [52-56[ 54 6 0,2 29 20% 96,5% [56-60] 58 1 0,033 30 3,3% 99,8%
Total 30 0,99 99,8%
b. 12 corderos pesan entre 44 y 52 Kg.
c. 59,9% representa a aquellos corderos
cuyo peso es inferior a 48 Kg.
d. Su frecuencia relativa para dicho
intervalo de clase es 0,233 corderos.
e. Un 23,3% de corderos pesan más de
52 Kg.
f. 𝑓3: 7 de 30 corderos pesan entre 44 y
48 Kg.
𝐹3%: Un 59,9% de los corderos
pesan a lo más 48 kilogramos.
3.-
a. Duración en horas de discos de
engranaje, Cuantitativa Continua.
b.
c. 13 discos duraron entre 290 y 300
horas.
d. 22 discos no alcanzaron a durar 300
horas.
e. El 6% de los discos duraron entre
310 y 315 horas.
f. El 58% de los discos duraron menos
de 305 horas.
g. 16 discos duraron más de 310 horas.
h. 29 discos duraron menos de 305
horas.
i. El 34% de los discos duraron entre
285 y 295 horas.
j. El primer intervalo es aquel con
mayor frecuencia absoluta.
4.-
a.
N° de
personas 𝒙𝒊 𝒏𝒊 𝒇𝒊 𝑵𝒊 𝒇𝒊% 𝑭𝒊%
[60-70[ 65 5 0,10 5 10% 10% [70-80[ 75 4 0,08 9 8% 18% [80-90[ 85 5 0,10 14 10% 28% [90-100[ 95 8 0,16 22 16% 44% [100-110[ 105 6 0,12 28 12% 56% [110-120[ 115 4 0,08 32 8% 64% [120-130[ 125 8 0,16 40 16% 80% [130-140[ 135 10 0,20 50 20% 100%
Total 50 1,00 100
b. 18 personas consumen entre 100 y
130 productos enlatados.
c. El 28% de las personas consumen
menos de 90 productos enlatados.
d. 41 personas consumen más de 80
productos enlatados.
Duración 𝒙𝒊 𝒏𝒊 𝒇𝒊 𝑵𝒊 𝒇𝒊% 𝑭𝒊% [285-290[ 287,5 9 0,18 9 18% 18% [290-295[ 292,5 8 0,16 17 16% 34% [295-300[ 297,5 5 0,1 22 10% 44% [300-305[ 302,5 7 0,14 29 14% 58% [305-310[ 307,5 5 0,1 34 10% 68% [310-315[ 312,5 3 0,06 37 6% 74% [315-320[ 317,5 3 0,06 40 6% 80% [320-325[ 322,5 6 0,12 46 12% 92% [325-330] 327,5 4 0,08 50 8% 100%
Total 50 1,00 100
170
5.-
a. Compañías de la industria de la
construcción.
b. 𝑅 = 9,6 − 0,1 = 9,5
𝑁 = 40
𝐾 = 1 + 3,3 log(40) = 6,28 ≈ 6
𝑎 =9,5
6= 1,58 ≈ 2
Ganancia 𝒙𝒊 𝒏𝒊 𝒇𝒊 𝑵𝒊 𝒇𝒊% 𝑭𝒊%
[0,1 – 2,1[ 1,1 17 0,425 17 42,5% 42,5%
[2,1 – 4,1[ 3,1 13 0,325 30 32,5% 75%
[4,1 – 6,1[ 5,1 7 0,175 37 17,5% 92,5%
[6,1 – 8,1[ 7,1 2 0,05 39 5% 97,5%
[8,1 – 10,1] 9,1 1 0,025 40 2,5% 100%
Total 40 1,00 100%
c. La frecuencia absoluta del tercer
intervalo es 7, es decir, existen 7
compañías cuyas ganancias están
entre 4,1 y 6,1 miles de millones por
acción.
d. El 92,5% de las compañías tienen a
lo más una ganancia de 6,1 miles de
millones por acción.
e. 10 compañías tienen a lo menos una
ganancia de 4,1 miles de millones por
acción.
f. 30 compañías tienen una ganancia
menor a 4,1 miles de millones por
acción.
g. El 97,5% de las compañías tienen
una ganancia por acción de a lo más
8,1 miles de millones.
6.-
X: Tiempo
(minutos)
𝒏𝒊 𝑵𝒊 𝑭𝒊 𝑭𝒊%
[300 – 400[ 14 14 0,035 3,5%
[400 – 500[ 46 60 0,15 15%
[500 – 600[ 58 118 0,295 29,5%
[600 – 700[ 76 194 0,485 48,5%
[700 – 800[ 68 262 0,655 65,5%
[800 – 900[ 62 324 0,81 81%
[900 – 1000[ 48 372 0,93 93%
[1000 – 1100[ 22 394 0,985 98,5%
[1100 – 1200[ 6 400 1,00 100%
Total 400
a. La frecuencia acumulada porcentual
de la cuarta clase es 48,5%, es decir,
48,5% de estudiantes ven hasta 700
minutos de televisión a la semana.
b. 𝐹5% = 65,5%
𝐹5 =262
400= 0,655
Por tanto 65,5% es lo mismo que
decir 262 de 400 estudiantes ven
televisión a lo más 800 minutos por
semana.
c. Un 19% de los estudiantes ven
televisión más de 900 minutos por
semana.
d. 118 estudiantes no ven televisión más
de 600 minutos por semana.
e. El porcentaje de estudiantes que ven
televisión por lo menos 500 minutos
por semana, pero menos de 1000
minutos por semana es de:
𝐹7% − 𝐹3% = 93% − 15% = 78%
f. Una proporción de 0,445 de
estudiantes ven televisión entre 700 y
1000 minutos por semana.
171
7.-
a. Edad de los habitantes de chile.
b. Un 38,5% de la población chilena se
encuentra entre los 25 y 50 años de
edad.
c. Un 59,2% de la población chilena se
encuentra en a lo menos los 40 años
de edad.
d. 𝑛5 = 826.874,4 ℎ𝑎𝑏𝑖𝑡𝑎𝑛𝑡𝑒𝑠
Interpretación: 826.875 habitantes de
Chile se encuentran en un rango de
edad entre 20 y 25 años.
e. Un 49,3% de la población tiene 35 o
más años. Un 87,3% de la población
tiene menos de 65 años.
f. Un 54,9% de la población tiene entre
menos de 20 o más de 50 años de
edad.
g. Un 5,7% de la población tiene más de
75 años de edad.
8.-
a.
Zona urbana Zona rural
X: Edad 𝒏𝒊 𝒇𝒊 𝒏𝒊 𝒇𝒊
[10-14[ 2.574 0,12 3.515 0,19
[14-18] 19.761 0,88 15.094 0,81
Total 22.335 1 18.609 1
Interpretación: Se observa que en la zona
rural existe un mayor número de hombres
que tienen relaciones sexuales en el rango
de edad más temprana.
9.-
a.
Volumen 𝒙𝒊 𝒏𝒊 𝒇𝒊 𝑵𝒊 𝑭𝒊
[5 – 10[ 7,5 1 0,037 1 0,037
[10 – 15[ 12,5 2 0,074 3 0,111
[15 – 20[ 17,5 6 0,222 9 0,333
[20 – 25[ 22,5 9 0,333 18 0,666
[25 – 30] 27,5 9 0,333 27 0,999
Total 27 0,999
𝑁4: 18 fueron las compras de materia
prima que tienen un volumen de a lo más
25 metros cúbicos.
𝐹3: 9 de 27 de las compras de materia
prima tienen un volumen menor a 20
metros cúbicos.
𝑓2: 2 de 27 de las compras de materia
prima tienen un volumen de entre 10 y
15 metros cúbicos.
b. 𝐹4 − 𝐹2 = 55,5%
Un 55,5% de la materia prima
comprada se encuentra entre 15 y 25
metros cúbicos.
𝑁5 − 𝑁3 = 18
18 fueron las compras de materia
prima que se encuentran en un
volumen entre 20 y 30 metros
cúbicos.
c. Individuo: materia prima.
Variable: volumen de materia prima
comprada.
d. 9 de 27 compras de materia prima
tienen un volumen menor a 20
metros cúbicos.
10.-
Solución al lector.
172
2.2 Presentación de la información en
gráficos estadísticos
1.-
a.
Volumen 𝒙𝒊 𝒏𝒊 𝒇𝒊 𝑵𝒊 𝑭𝒊
[5 – 10[ 7,5 1 0,037 1 0,037
[10 – 15[ 12,5 2 0,074 3 0,111
[15 – 20[ 17,5 6 0,222 9 0,333
[20 – 25[ 22,5 9 0,333 18 0,666
[25 – 30] 27,5 9 0,333 27 0,999
Total 27 0,999
b. Histograma y polígono de frecuencia.
Se observa que para ambos muestran
la misma información, ambos
muestran la marca de clase. Se
observa que la muestra es bimodal ya
que los dos últimos intervalos son lo
que tienen una mayor frecuencia.
c. Ojiva.
Interpretación: El 66,6% de las compras
de materia prima alcanzaron un volumen
máximo de 25 metros cúbicos.
d. El volumen máximo que alcanzaron
fue de 20 metros cúbicos.
e. Se realizaron 24 compras entre 15 y
30 metros cúbicos de materia prima.
f. Se realizaron 9 compras de a lo más
20 metros cúbicos.
g. Interpretación: 18 de 27 compras de
materia prima fueron de a lo más 25
metros cúbicos.
h. Se realizaron 27 compras en total.
2.-
a.
Tiempo 𝑥𝑖´ 𝑛𝑖 𝑓𝑖 𝑁𝑖 𝐹𝑖
[450 – 500[ 475 4 0,08 4 0,08
[500 – 550[ 525 5 0,1 9 0,18
[550 – 600[ 575 12 0,24 21 0,42
[600 – 650[ 625 10 0,2 31 0,62
[650 – 700[ 675 15 0,3 46 0,92
[700 – 750[ 725 3 0,06 49 0,98
[750 – 800[ 775 1 0,02 50 1,00
Total 50
b. Ojiva
Interpretación: El 42% de las válvulas
tienen a lo más una duración de 600
horas.
173
c. Un 36% de las válvulas duraron entre
650 y 750 horas.
d. 9 válvulas duraron menos de 550
horas.
e. Un 38% de las válvulas duraron más
de 650 horas.
3.-
a. Histograma experimento A
b. Ojiva porcentual experimento B
c. Polígonos de frecuencia juntos.
Comparación: En los intervalos centrales
podemos observar que en el experimento
B presenta una mayor frecuencia que en
el experimento A.
d. Ojivas juntas.
Comparación: el experimento B es aquel
que tiene un crecimiento más constante
que el experimento A.
4.-
a. Los límites del cuarto intervalo son
60,5-70,5
b. 6 alumnos tienen un peso que va
desde 60,5 kilos hasta 70,5 kilos.
c. 36% de los alumnos pesan más de
70,5 kilos y menos de 80,5 kilos.
d. El 12% de los pesos de los alumnos
es igual o menor que 60,5 kilos.
e. 24 alumnos pesan más de 50,5 kilos.
5.- a.
Puntaje 𝒙𝒊´ 𝒏𝒊 𝒇𝒊 𝒇𝒊% 𝑵𝒊 𝑭𝒊 𝑭𝒊%
[55-63[ 59 3 0,093 9,3% 3 0,093 9,3
[63-71[ 67 6 0,187 18,5% 9 0,28 28
[71-79[ 75 3 0,093 9,3% 12 0,373 37,3
[79-87[ 83 13 0,406 40,6% 25 0,779 77,9
[87-95[ 91 3 0,093 9,3% 28 0,872 87,2
[95-103] 99 4 0,125 12,% 32 0,997 99,7
Total 32 0,997 1000%
b. El mejor gráfico para representar los
datos es el histograma.
174
6.-
a. La variable es cualitativa nominal.
b.
c. Hay un 40,2% de basura entre
plástico, papel y aluminio.
d. El mayor porcentaje de basura se
concentra en la materia orgánica.
e. El menor porcentaje de basura se
encuentra en los desperdicios
peligrosos.
7.-
a. Familias que residen en un pequeño
pueblo del sur de Chile.
b.
Tiempo 𝒙𝒊´ 𝒏𝒊 𝒇𝒊 𝒇𝒊%
[4-6[ 5 2 0,066 6,6%
[6-8[ 7 8 0,266 26,6%
[8-10[ 9 8 0,266 26,6%
[10-12[ 11 7 0,233 23,3%
[12-14[ 13 4 0,133 13,3%
[14-16 [ 15 1 0,033 3,3%
Total 30 0,987 100%
c. Polígono
Interpretación: La mayor frecuencia del
tamaño del grupo familiar se encuentra en
el segundo y tercer intervalo.
d. No porque el histograma se construye
cuando la variable de estudio es una
variable cuantitativa continua.
8.-
a.
0,1 | 7 9
0,2 | 0 2 4 6 6 6 8 8 9
0,3 | 0 0 1 1 2 3 3 3 5 5 7 7 8
0,4 | 2 4 5 8
0,5 | 0 1
0,6 | 3
Interpretación: La mayoría de las
compañías tienen una volatilidad de 0,3
hasta 0,38.
b. El último tallo fue donde hubo mayor
tendencia al cambio del precio por
acción.
175
c. El primer tallo fue donde hubo menor
tendencia al cambio del precio por
acción.
d. El valor del dato que más se repite es
el 0,26 en conjunto con el 0,33.
9.1.-
a. Las bolsas de valores de diferentes
países.
b. El grafico muestra las caídas de las
bolsas de valores internacionales y la
mayor caída fue en Hong Kong,
mientras que la menor caída fue en el
país de Chile
c. Chile tiene una caída de su bolsa con
la situación de China.
d. El país de Reino Unido cayó un
0,91%, Brasil un 1,07% y Japón un
3,14%
e. La construcción del grafico no es la
más adecuada ya que muestra
demasiada información y todo está
demasiado junto. Además se mesclan
diferentes gráficos.
9.2.-
a. Población en riesgo de pobreza en
española.
b. Un 1,2% ha aumentado la pobreza
entre los años 2010 y 2013 en
España.
c. Tabla de frecuencias
Pobreza por año en
millones
𝒏𝒊 𝒇𝒊
2008 11,458 0,245
2009 11,552 0,247
2010 11,684 0,261
2011 12,487 0,267
2012 12,721 0,272
2013 12,768 0,273
2014 13,656 0,292
d. Solución al lector.
CONTROL UNIDAD
a. V
b. F, Nos indica el porcentaje de
elementos menores o iguales que el
límite superior de la clase i.
c. F, El utiliza preferentemente el
gráfico de barras.
d. V
e. V
f. V
g. V
h. F, Sí importa la interpretación que se
le puede dar.
i. V
j. V
k. F, No debe incluir muchos intervalos.
l. V
m. F, El eje vertical no se debe cortar.
n. V
176
EJERCICIOS TIPO PRUEBA
1.-
a.
Interpretación: existen muy pocos
pacientes con tumores de alta duración
(mayor a 22 meses), que aquellos con
poca duración (menor a 10 meses)
b. El dato que tiene mayor frecuencia es
3 meses, con una frecuencia de 10
pacientes. El dato con mayor
frecuencia si pertenece al intervalo
con mayor frecuencia.
2.-
a. Histograma
Interpretación: e observa que muy pocos
estudiantes obtienen un coeficiente
intelectual alto (mayor a 130, es decir,
súper dotados.
b. En el primero, segundo y tercer
intervalo de clase.
c. Sí, en los tres primeros intervalos.
d. No.
3.- Histograma con 5 intervalos
Interpretación: La mayor renta por
contribuyentes se concentra en una renta
de 26.
Histograma con 10 intervalos
Interpretación: la menor renta considerada
por contribuyentes es de 97,5 de renta.
c. El segundo muestra más información,
pues éste muestra en dos intervalos lo que
el primero muestra en un solo intervalo.
177
4.-
a.
X: puntajes obtenido
en la prueba
𝒏𝒊
𝒇𝒊
[6 – 9[ 10 0,05
[9 – 12[ 14 0,07
[12 – 15[ 18 0,09
[15 – 18[ 38 0,19
[18 – 21[ 67 0,335
[21 – 24[ 42 0,21
[24 – 27] 11 0,055
total 200 1
b. Histograma de frecuencias
relativas
c. La amplitud es adecuada, sin
embargo la cantidad de intervalos
puede variar para la misma amplitud.
Pero lo ideal es realizar 9 intervalos
según la fórmula enseñada en el
curso de Estadística.
5.-
a.
Tiempo de reacción a un estimulo
0 | 4 5 6 6 7 7 7 9 9
1 | 1 1 2 2 3 3 3 5 5 5 6 6 7 8 8 8 8
2 | 0 1 1 2 3 4 4 5 5 6 6 6 8 8 8 9 9
3 | 0 1 2 2 3
Interpretación: se observa que la mayoría
de los tiempos de reacción se encuentran
entre 1,1 y 2,9 segundos.
b. No es posible ya que disminuiría
demasiado las frecuencias de cada
tallo, es decir no tendría hojas el
grafico.
c. Si se puede construir un nuevo
grafico, pues consideraríamos el
número entero y a decima como tallo
y la centésima como hoja,
obteniéndose más tallos en el grafico.
El segundo grafico seria más
informativo.
d. El tiempo de reacción es 1,8.
6.-
a.
Ingreso diario de los
estacionamientos públicos
3 | 2
5 | 2 7 8 9
6 | 5 8 8
7 | 1 4 5 5 8 9
8 | 0 1 3 3 3 4 8 8
9 | 0 3 4 7
10 | 0 4 8
Interpretación: En el tallo 8 se encuentra
la mayor frecuencia, mientras que el tallo
3 es donde se encuentra la menor
frecuencia.
b. Sí, el valor $32.000, pues es muy
bajo en comparación con los demás
precios.
c. El valor diario más frecuente es
$83.000.
178
7.-
a.
Estatura 𝑛𝑖 fi 𝑓𝑖% 𝑁𝑖 𝐹𝑖 𝐹𝑖%
[1,00-1,17[ 4 0,133 13,3 4 0,133 13,3
[1,17-1,34[ 3 0,1 10 7 0,233 23,3
[1,34-1,51[ 8 0,266 26,6 15 0,499 49,9
[1,51-1,68[ 7 0,233 23,3 22 0,732 73,2
[1,68-1,85[ 4 0,133 13,3 24 0,865 86,5
[1,85-2,02] 4 0,133 13,3 30 0,998 99,8
Total 30 0,998 100
b. 𝐹3%: La estatura del 49,9% de los
trabajadores es de a lo más 1,51
metros.
𝑓4: 7 de 30 trabajadores mide entre
1,51 y 1,68 metros.
𝑛2: La estatura de 3 de los
trabajadores está entre 1,17 y 1,34
metros.
𝐹5%-𝐹2% = 86,5% − 23,3% =
63,2%: El 63,2% de los trabajadores
mide entre 1,34 y 1,85 metros.
c. El 73,2% de los trabajadores mide
hasta 1,68 cm.
d.
Interpretación: se observa que la estatura
más frecuente en de 1,425 metros.
UNIDAD III
EJERCICIOS PROPUESTOS
3.1 Medidas de tendencia central
y posición.
1.-
a. 26,66 años.
Interpretación: Si todos los
trabajadores tuvieran la misma edad,
ésta sería de 26,66 años,
2.-
a. 164,5 cm.
Interpretación: Si todos los
estudiantes tuvieran la misma
estatura, ésta sería de 157,7 cm.
3.- Sin agrupar
𝜇 = 52,94 𝑝𝑢𝑛𝑡𝑜𝑠
Agrupados en intervalos
𝜇 = 55,5 𝑝𝑢𝑛𝑡𝑜𝑠
Al calcular la media de los datos sin
agrupar se obtiene el valor exacto, en
cambio al calcularla con los datos
agrupados se obtiene una aproximación
de la misma, de modo que el valor se ve
afectado dependiendo de la cantidad de
intervalos y la naturaleza y tamaño de la
población.
Si la población es muy grande el cálculo
de la media se vuelve complicado y puede
inducir errores al manejar un gran número
de datos, en esos casos es recomendable
agrupar los datos, ya que la media de los
datos agrupados es una buena
aproximación de la media de los datos sin
agrupar.
4.-
La venta faltante es de $690.
179
5.-
a. �̅� = 7,90
Interpretación: Si todos tuvieran la misma
distribución de frecuencias en la variable
X, esta sería de 7,9.
𝑀𝑒(𝑥) = 8
Interpretación: 8 es el dato central de la
distribución de la muestra.
Interpretación: La muestras es bimodal,
estas son 8 y 12.
b. Solución al lector.
c. La media aritmética, mediana y moda
se comportan de forma lineal
respecto de un cambio de origen y de
escala, por tanto los resultados serán.
�̅� = 28,7
𝑀𝑒 = 29
La muestres es bimodal, estas son 29 y
41.
6.- 𝑛3 = 7
7.-
a.
𝜇 = 7.590 𝑝𝑒𝑠𝑜𝑠
𝑀𝑒(𝑥) = 7.525 𝑝𝑒𝑠𝑜𝑠
𝑀𝑜(𝑥) = 7.435,714 𝑝𝑒𝑠𝑜𝑠
𝑃30 = 7.212,5 𝑝𝑒𝑠𝑜𝑠
𝐷8 = 8.233,33 𝑝𝑒𝑠𝑜𝑠
b. Un 74% de los trabajadores recibe al
menos $7.150 pesos en incentivos
mensuales.
8.-
a. La mediana de muestra es de 127,4
mm Hg. El 50% de la muestra tiene a
lo más una presión sanguínea de
127,4 mm Hg.
b. El valor de la mediana cambia a
127,6. La mediana en este caso
cambia en su valor, no obstante el
dato del paciente sigue ocupando la
misma posición.
9.-
a. 𝑄1 = 4
𝑄3 = 6
b. 𝑃30 = 4
𝑃70 = 6
c. El primer cuartil corresponde al
percentil 25, valores relativamente
cercanos, por otro lado el tercer
cuartil corresponde al percentil 75,
también valores relativamente
cercanos, en este caso coinciden
respectivamente.
d. La media corresponde al segundo
cuartil, son el mismo valor, a su vez
equivalen al percentil 50.
10.-
a. 𝑄1 = 52,8
El 25% de los datos tiene a lo más un
valor de 52,8.
180
𝑄3 = 65,666
El 75% de los datos tiene a lo más un
valor de 65,7.
b.
La diferencia entre el primer y tercer
cuartil corresponde al recorrido
intercuartílico, que abarca el 50% central
de los datos, es decir, el 50% central de
los datos tiene a lo menos un valor de
52,8 y a los más un valor de 65,7.
c. 𝑃40 = 57,248
El 40% de los datos tiene a lo más un
valor de 57,25.
𝑃90 = 72,133
El 90% de los datos tiene a lo más un
valor de 72,13.
d. Solución al lector.
11.-
222 corresponde al percentil 54,666.
230 corresponde al percentil 93,333.
12.-
a.
𝒙𝒊 𝒏𝒊 𝒏𝒊 ∙ 𝒙𝒊 𝒙𝒊 − �̅� |𝒙𝒊 − �̅�| 𝒏𝒊 ∙ |𝒙𝒊 − �̅�| 41 1 41 41-46=-5 5 5
42 2 84 42-46=-4 4 8
44 4 176 44-46=-2 2 8
46 6 276 46-46=0 0 0
48 4 192 48-46=2 2 8
50 2 100 50-46=4 4 8
51 1 51 51-46=5 5 5
∑ 𝟐𝟎 ∑=920 ∑ = 0 ∑ = 22 ∑ = 42
b.
�̅� = 46 𝑎𝑣𝑖𝑜𝑛𝑒𝑠.
c. Solución al lector.
13.-
a. 𝜇 = 27.500 𝑝𝑒𝑠𝑜𝑠
Interpretación: si todos los trabajadores
tuvieran el mismo sueldo, este sería de
27.500 pesos.
b. 𝑀𝑒(𝑥) = 23.333,333 𝑝𝑒𝑠𝑜𝑠
Interpretación: el 50% de los trabajadores
cobran a lo más 23.333,333 pesos.
𝑀𝑜(𝑥) = 18.000 𝑝𝑒𝑠𝑜𝑠
Interpretación: el sueldo cobrado con
mayor frecuencia es de 18.000 pesos.
Dado que la moda está por debajo de la
mediana la muestra está sesgada hacia la
derecha.
c. Un 70% de los trabajadores cobrarán
a lo más $30.000 semanas.
d. Un 50% de los trabajadores no
cobran entre $20.000 y $50.000.
3.2 Medidas de dispersión o
variabilidad.
1.-
a. Resultado obtenido en cada
lanzamiento, que es una variable
cuantitativa discreta.
b. 𝜇 = 3,8 ≈ 4 𝑣𝑒𝑐𝑒𝑠
Interpretación: si en todos los
lanzamientos hubiesen obtenido el mismo
resultado, este sería de 4
181
𝜎 = 1,749 ≈ 2 𝑣𝑒𝑐𝑒𝑠
Interpretación: la variabilidad de los
resultados de los lanzamientos con
respecto a la media es de 2.
c. Entre 𝜇 − 𝜎 y 𝜇 + 𝜎 queda un 88%
de los resultados.
d. En un 43% de los lanzamientos se ha
obtenido una puntuación mayor que
la media.
2.-
a. �̅� = 3,1 ≈ 4 𝑝𝑒𝑟𝑠𝑜𝑛𝑎𝑠
𝑠 = 1,11 ≈ 2 𝑝𝑒𝑟𝑠𝑜𝑛𝑎𝑠
b. La desviación típica mantiene su
valor, es una de las propiedades de
ésta.
c. Entre �̅� − 𝑠 y �̅� + 𝑠 queda un 70% de
las familias.
d. Un 72% de las familias tiene un
número de integrantes menor que la
media.
3.-
a. 𝜇 = 3,74
𝜎 = 1,556
b. 𝜇 = 0,37
𝜎 = 0,155
Propiedad de la media y la desviación
típica es que si los datos son
multiplicados por un número el valor de
cada una será el original multiplicado por
dicho número.
c. El 53,2% de los alumnos obtienen
notas mayores que la media.
4.-
a. 𝐶. 𝑉𝐴 = 0,26̅ → 26,66%
𝐶. 𝑉𝐵 = 0,313̅ → 31,33%
b. Hay levemente una mayor variación
relativa de la media respecto de la
desviación estándar en la empresa B,
por tanto en la empresa A el
promedio es levemente más
representativo que en la empresa B.
c. Solución al lector.
5.-
a. 𝐶. 𝑉𝐴 = 0,234 → 23,4%
𝐶. 𝑉𝐵 = 0,19 → 19%
Existe una mayor variación relativa para
el producto A.
b. Si la desviación estándar tiende a
cero y la media aritmética se
mantiene constante el coeficiente de
variación tenderá a cero, ya que el
coeficiente de variación compara
dichos valores mediante un cociente.
c. Si la media aritmética tiende a cero y
la desviación estándar se mantiene
constante el coeficiente de variación
tenderá a infinito, ya que el
coeficiente de variación compara
dichos valores mediante un cociente.
182
6.-
a. 𝐶. 𝑉𝑉 = 0,071 → 7,1%
𝐶. 𝑉𝑀 = 0,045 → 4,5%
Las interpretaciones quedan al lector.
Debido a que la diferencia entre los
coeficiente de variación es ínfima no
podemos asegurar que hay una mayor o
menor variación relativa entre las
estaturas de varones y mujeres.
b. Solución al lector.
7.-
a. 𝑠 = 1,316
b. 𝑠𝐷 = 0,3948
c. 𝐶. 𝑉𝐵 = 0,16 → 16%
𝐶. 𝑉𝐷 = 0,7311 → 73,11%
Hay una mayor variación relativa de la
media respecto de la desviación estándar
en las baterías deterioradas, por tanto en
las baterías deterioradas el promedio es
menos representativo que en las baterías
en buen estado.
3.3 Construcción e interpretación del
diagrama de cajón con bigotes (box
plot).
1.-
a. 𝑅𝑎𝑛𝑔𝑜 = 9
b. Un 25% de los estudiantes se queda
dormido antes de los 14 minutos con
el profesor A, ya que es el extremo
inferior del cajón.
c.
El primero no es simétrico como el
segundo.
2.-
a. El 50% de las determinaciones de
emisión diaria son a los más de 19,05
toneladas.
El 75% de las determinaciones de
emisión diaria son a los más de 22,95
toneladas.
183
b.
c. En la muestra hay presencia de datos
anómalos revelados por la extensión
de los bigotes del cajón.
3.-
a. El 50% central de las vacas posee
entre un 3,756% y un 4,027% de
grasa en la leche.
En la muestra hay presencia de datos
anómalos revelados por la extensión de
los bigotes del cajón.
4.-
a. 𝑀𝑒(𝑥) = 41
Interpretación: el 50% de los clientes
tienen a lo más 41 como talla.
b. 𝜇 = 40,866
Interpretación: si todos los clientes
tuvieran la misma talla de zapatos, esta
sería de 40,866.
c. 𝑄1 = 40
Interpretación: el 25% de los clientes
tienen a lo más 40 como talla.
𝑄3 = 42
Interpretación: el 75% de los clientes
tienen a lo más 42 como talla.
d.
184
3.4 Medidas de asimetría y curtosis.
a. Grupo 1
𝐴𝑠 = 0,8164
Puesto que el índice de asimetría es
mayor que cero, estamos frente a una
asimetría positiva.
𝐶𝑟 = −1
Ya que el índice de curtosis es menor que
cero el apuntamiento de la distribución es
platicúrtico.
Grupo 2
𝐴𝑠 = −0,426
Puesto que el índice de asimetría es
menor que cero, estamos frente a una
asimetría negativa.
𝐶𝑟 = −2,322
Ya que el índice de curtosis es menor que
cero el apuntamiento de la distribución es
platicúrtico.
2.-
a. Antofagasta:
𝐴𝑠 = −0,561
Puesto que el índice de asimetría es
menor que cero, estamos frente a una
asimetría negativa.
𝐶𝑟 = −1,327
Ya que el índice de curtosis es menor que
cero el apuntamiento de la distribución es
platicúrtico.
Santiago
𝐴𝑠 = −0,510
Puesto que el índice de asimetría es
menor que cero, estamos frente a una
asimetría negativa.
𝐶𝑟 = 1,396
Ya que el índice de curtosis es mayor que
cero el apuntamiento de la distribución es
leptocúrtica.
Punta Arenas
𝐴𝑠 = 0,800
Puesto que el índice de asimetría es
mayor que cero, estamos frente a una
asimetría positiva.
𝐶𝑟 = −1,414
Ya que el índice de curtosis es menor que
cero el apuntamiento de la distribución es
platicúrtico.
b. Las temperaturas de la ciudad de
Santiago son más simétricas en
comparación con las demás ciudades.
c. Solución al lector.
3.- 𝐴𝑠 = −0,263
Puesto que el índice de asimetría es
menor que cero, estamos frente a una
asimetría negativa.
𝐶𝑟 = −0,958
Ya que el índice de curtosis es menor que
cero el apuntamiento de la distribución es
platicúrtico.
185
4.-
a. 𝐴𝑠 = 0,656
Puesto que el índice de asimetría es
mayor que cero, estamos frente a una
asimetría positiva.
𝐶𝑟 = −1,211
Ya que el índice de curtosis es menor que
cero el apuntamiento de la distribución es
platicúrtico.
5.1.- Solución al lector
5.2.- Solución al lector
CONTROL UNIDAD
a.
�̅� =∑ 𝑎𝑖
𝑛𝑖=1
𝑛
=1
𝑛∑ 𝑎𝑖
𝑛
𝑖=1
=1
𝑛(𝑎1 + 𝑎2 + ⋯ + 𝑎𝑖 + ⋯ + 𝑎𝑛)
=1
𝑛(𝑛 ∙ 𝑎)
=𝑛
𝑛∙ 𝑎
= 𝑎
Por lo tanto �̅� = 𝑎
b.
𝜇𝑥+𝑦 =1
𝑁∑(𝑥𝑖 + 𝑦𝑖)
𝑁
𝑖=1
=1
𝑁(∑ 𝑥𝑖
𝑁
𝑖=1
+ ∑ 𝑦𝑖
𝑁
𝑖=1
)
=1
𝑁∑ 𝑥𝑖
𝑁
𝑖=1
+1
𝑁∑ 𝑦𝑖
𝑁
𝑖=1
= 𝜇𝑥 + 𝜇𝑦
c. Sea 𝑥1 … 𝑥𝑛, un conjunto de datos.
𝜇𝑦 =1
𝑁∑ 𝑦𝑖
𝑁
𝑖=1
=1
𝑁∑(𝑎 ∙ 𝑥𝑖 + 𝑏)
𝑁
𝑖=1
=1
𝑁(∑ 𝑎 ∙ 𝑥𝑖
𝑁
𝑖=1
+ ∑ 𝑏
𝑁
𝑖=1
)
1
𝑁∑ 𝑎 ∙ 𝑥𝑖
𝑁
𝑖=1
+1
𝑁∑ 𝑏
𝑁
𝑖=1
= 𝑎 ∙1
𝑁∑ 𝑥𝑖
𝑁
𝑖=1
+𝑁 ∙ 𝑏
𝑁
= 𝑎 ∙ 𝜇𝑖 + 𝑏
d. Solución al lector.
e. Solución al lector.
186
EJERCICIOS TIPO PRUEBA
1.- Solución al lector.
2.- Solución al lector.
3.-
a. �̅� = 94,24 ; 𝑀𝑜(𝑥) = 96,333
b. Un 43% de los alumnos que tienen
un coeficiente intelectual entre 93 y
109.
c. El C.I. 90 corresponde al percentil
36,5.
d. Un 69% de los alumnos tienen a lo
más un 101 de coeficiente intelectual.
4.-
a. La estación 1 y 3 tienen mismo rango
de lluvia caída en doce meses.
b. Rango intercuartílico, rango.
c. Rango = 6
Rango intercuartílico = 4
d. Aproximadamente 3 meses llovió
menos de 8 milímetros de agua.
e. Solución al lector.
f. 𝜇 = 9,666 𝑚𝑚
𝑀𝑒(𝑥) = 10,5 𝑚𝑚
𝑀𝑜(𝑥) = 11 𝑚𝑚
𝜎 = 3,009 𝑚𝑚
𝑅 = 12 𝑚𝑚
g. Diagrama de cajas
5.-
a. 𝜇 = 8,8 ℎ𝑜𝑟𝑎𝑠
𝑀𝑒(𝑥) = 9 ℎ𝑜𝑟𝑎𝑠
𝑀𝑜(𝑥) = 9 ℎ𝑜𝑟𝑎𝑠
𝜎 = 1,239 ℎ𝑜𝑟𝑎𝑠
𝑅 = 5 ℎ𝑜𝑟𝑎𝑠
b. Diagrama de cajas
187
c. Diagrama de tallos y hojas
6.-
a. Variable: número de errores por
pagina de un texto.
Tipo de variable: cuantitativa
discreta.
b.
N°
errores 𝒙𝒊
´ 𝒏𝒊 𝑵𝒊 𝒇𝒊 𝒇𝒊% 𝑭𝒊%
[0 – 2[ 1 16 16 0,32 32 32
[2 – 4[ 3 20 36 0,4 40 72
[4 – 6[ 5 9 45 0,18 18 90
[6 – 8[ 7 3 48 0,06 6 96
[8 – 10[ 9 2 50 0,04 4 100
Total 50 1 100
c. Diagrama de barras
d. Un 32% de las páginas tienen dos
errores.
e. Un 90% de las páginas tienen a los
más 6 errores.
Un 10% de las páginas tiene 6 o más
errores.
f. Un 19% de las páginas tienen como
mínimo 5 errores por página.
g. Solución al lector.
h. Solución al lector.
i. Diagrama de cajas
7.-
a.
X 𝒙𝒊´ 𝒏𝒊 𝑵𝒊 𝒇𝒊 𝒇𝒊% 𝑭𝒊%
[60-70[ 65 2 2 0,016 1,6 1,6
[70-80[ 75 3 5 0,025 2,5 4,1
[80-90[ 85 25 30 0,208 20,8 24,9
[90-100[ 95 46 76 0,383 38,3 63,2
[100-110[ 105 35 111 0,291 29,1 92,3
[110-120[ 115 5 116 0,041 4,1 96,4
[120-130[ 125 3 119 0,025 2,5 98,9
[130-140[ 135 1 120 0,008 0,8 99,7
Total 120 0,997 99,7
b. �̅� = 96,75
Interpretación: si todos los alumnos
tuvieran el mismo coeficiente intelectual,
este sería de 96,75.
𝑀𝑜(𝑥) = 96,562
Interpretación: el coeficiente intelectual
más frecuente es de 96,562.
188
𝑀𝑒(𝑥) = 96,521
Interpretación: el 50% de los alumnos
tienen a los más un coeficiente
intelectual de 96,521.
𝑆𝑥 = 11.201
Interpretación: la variabilidad con
respecto al promedio del coeficiente
intelectual es de 11,201.
𝑅𝐼 = 𝑄3 − 𝑄1 = 104 − 90 = 14
Interpretación: el 50% central de los
puntajes del coeficiente intelectual varían
en 14 puntos.
c. Diagrama de cajas
d. El coeficiente intelectual mínimo que
se requiere para ser bien dotado es de
116.
e. Un alumno que tiene un coeficiente
intelectual de 109, se encuentra en el
percentil 89,58.
f. 114 de 120 alumnos tienen un C.I.
entre 70 y 120 puntos.
UNIDAD IV
EJERCICIOS PROPUESTOS
4.1 Distribución de frecuencias
conjunta, marginales y condicionales.
1.-
a. 20
39 estudiantes son fumadores.
b. 6
39 mujeres que no fuman.
c. 12
39 son hombres fumadores. El resto
de los alumnos no fuma o es mujer.
d.
Sexo 𝑓𝑖⦁
Hombre 0,641
Mujer 0,358
Total 0,999
e.
Sexo 𝑛𝑖⦁
Hombre 25
Mujer 14
Total 39
f.
Sexo/fumadores 𝑓𝑖.
Hombre 0,6
Mujer 0,4
Total 1
189
2.-
a. Distribución marginal de X
X 𝑛𝑖⦁
12 14
15 28
19 42
Distribución marginal de Y
Y 𝑛⦁𝑗
15 18
24 24
27 12
30 30
Veamos si las variables son
independientes
¿𝑛11 = 𝑛⦁1 ∙ 𝑛1⦁?
3 ≠ 14 ∙ 18 = 252 Luego las variables
son dependientes pues siendo una
distribución conjunta diferente de la
multiplicación de las marginales ya no
son independientes estas variables.
b. Solución al lector.
3.-
a.
X/Y 0 1 2 3 4
1 24 39 27 18 9
2 9 24 24 27 21
3 3 9 18 24 24
b.
Y 𝑛⦁𝑗
0 36
1 72
2 69
3 69
4 54
�̅� = 2,11 𝑆𝑦 = 1,287
El número medio de compras semanales
es de 2,11 con una variación de 1,287
compras pagadas con tarjeta de crédito.
c.
X 𝑛𝑖⦁
1 117
2 105
3 78
El número más frecuente de tarjetas de
créditos es 1 por persona.
d.
𝑌/𝑋3 𝑛3𝑗
0 3
1 9
2 18
3 24
4 24
�̅�/𝑋3 = 2,730
El número medio de compras semanales
pagadas por personas que poseen tres
tarjetas de créditos es de 2,730 compras.
4.-
a. �̅� = 1,56 hombres
𝑆𝑋2 = 1,541 hombres2
𝑆𝑋 = 1,241 hombres
�̅� = 1,46 mujeres
𝑆𝑌2 = 1,301 mujeres2
𝑆𝑌 = 1,140 mujeres
b. (�̅�/𝑋 = 2) = 1,291 ≈ 2
c. (�̅�/𝑌 = 0) = 1,826 ≈ 2
d. (�̅�/𝑌 ≤ 2) = 1,592 ≈ 2
190
5.-
a.
X/Y<22 𝑛⦁<22
[3 – 5[ 0,01
[5 – 7[ 0,14
[7 – 9] 0,32
X/Y>26 𝑛⦁>26
[3 – 5[ 0,40
[5 – 7[ 0,01
[7 – 9] 0,00
La homogeneidad en este caso no se
puede calcular, pues en este ejercicio no
se dice cual es el total de la muestra.
b. El 21% de los pacientes tienen entre
18 y 26 años de edad.
c. (�̅�/5 < 𝑋 < 7) = 19,333
d. Dependencia:
¿𝑛11 ≠ 𝑛⦁1 ∙ 𝑛1⦁? → 0,00 ≠ 0,5 ∙
0,38 = 0,19
0,00 ≠ 0,19
Luego las variables son dependientes.
e. Solución al lector.
6.-
a.
X 𝑛𝑖⦁
[0 – 30[ 20
[30 – 90[ 50
[90 – 180] 30
�̅� = 73,5 𝑚𝑖𝑙𝑒𝑠
𝑀𝑒 = 66
b.
Y 𝑛⦁𝑗
[0 – 15[ 20
[15 – 30[ 10
[30 – 60 [ 30
[60 – 100] 40
�̅� = 49,25 𝑎ñ𝑜𝑠
𝑆𝑌 = 28,494 𝑎ñ𝑜𝑠
c.
Y/60<X<90 𝑛⦁30<𝑥<90
[0 – 15[ 12
[15 – 30[ 2
[30 – 60[ 15
[60 – 100] 21
d.
X/60<Y<90 𝑛60<𝑦<100⦁
[0 – 30[ 3
[30 – 90[ 21
[90 – 180] 16
4.2 medidas de asociación para
variables cuantitativas.
1.-
a. 𝑟 = 0,640
La asociación lineal entre los años y el
nivel de satisfacción es positiva y alta.
b. �̂� = 4,481 + 0,342𝑥
�̂� = 4,481 + 0,342⦁11 = 8,252
Cuando se lleva 11 años en el sindicato,
el índice de satisfacción es de 8,252.
6 = 4,481 + 0,342𝑥 ⇒ 𝑥 =4,429 años
191
2.-
a.
Q/B 2 3 4 5 6 7
2 0 0 0 1 0 1
3 0 0 1 0 0 0
4 0 0 1 2 0 2
5 1 0 0 2 0 1
6 1 0 0 1 1 1
7 0 1 0 2 3 3
b. 8 de 25 alumnos obtuvieron notas
mayores de un 5 en ambas
asignaturas.
12 de 25 alumnos obtienen más de un
5 como nota en la asignatura de
biología.
13 de 25 alumnos obtienen más de un
5 como nota en la asignatura de
química.
c.
B/Q=6 2 3 4 5 6 7
n 1 0 0 1 1 1
1 de 4 alumnos obtuvo la mejor nota en
biología dado que tenga un 6 en química.
d. 𝑟 = 0,056
A los alumnos que les va bien en
biología, no necesariamente les va ir bien
en química, pues las variables tienen una
asociación lineal casi nula.
3.-
a. En el país A nos dice que las
variables están asociadas
positivamente pero su fuerza de
asociación es baja.
En el país B nos dice que las
variables están asociadas
positivamente y su fuerza de
asociación es fuerte.
4.-
𝑟 = 1 Podemos afirmar que las variables
precio y consumo están asociadas fuerte y
positivamente.
5.-
a. �̅� = 20,5 ; 𝑆𝑥 = 8,255
�̅� = 6,6 ; 𝑆𝑦 = 3,500
b. 𝑆𝑋𝑌 = 19,7
Las variables están asociadas
positivamente.
c. Si se aumenta en un millón de de
pesos la covarianza no se ve afectada.
Si se aumenta la renta en un 6%,
entonces la covarianza incrementara
en un 6%.
4.3 análisis de regresión lineal simple.
1.-
a. 𝑟 = 0,638 Si existe una correlación
lineal, estas están asociadas fuerte y
positivamente.
b. �̂� = 1,875 + 0,59375𝑥
�̂� = 1,613 + 0,6855𝑦
192
2.-
a. 0,4793
Interpretación: la distribución del
número de días de licencia de los
trabajadores es asimétrica hacia la
derecha.
b. La edad más frecuente de personas
que piden licencia es de 34,285 años.
c. �̂� = 0,8931𝑥 − 11,013
3.-
a. 𝑟 = −0,996. Hay una relación muy
fuerte y negativa entre las dos
variables. A medida que pasa el
tiempo la altura va bajando (se va
consumiendo el agua)
b. Cuando hayan transcurrido 40 horas,
la altura del agua habrá descendido a
8,841 metros.
c. Tienen que pasar 65,991 horas para
que suene la alarma.
4.-
a.
b. �̂� = −9,813 + 0,1714𝑥
A medida que aumenta la presión sonora
en un decibel, la presión sanguínea
disminuirá en 0,1714.
5.-
a. �̂� = 0,5𝑦 + 75
b. 𝑟 = 0,461 𝑟2 = 0,2127
El modelo no es el más apropiado, ya
que solo está asociado un 0,461 y
además solo está explicando un
21,27% los datos.
c. Para una renta de 241.000 se
consume un total de 332 en miles.
4.4 gráficos que muestran asociación
entre variables.
1.-
a.
b. Solución al lector.
2.-
a. 𝐿𝑃𝑠̅̅ ̅̅ ̅ = 9
El número medio de LPs vendidas es
de 9 ventas.
b. �̂� = 1,420𝑥 + 28,217 c. Se prevén 30,773 conciertos para este
verano si se venden 1800 LPs
193
3.-
a. El consumo es dependiente.
La renta es independiente.
b.
4.-
a. �̂� = 39,941 + 0,447𝑋
b.
5.-
a. �̂� = 3,798𝑥 + 27,823
b.
c. Al cabo de 6 horas habrán 50,614
gérmenes. Es una buena predicción
pues el modelo de regresión explica
un 95,157%
6.-
a. �̂� = 0,6515𝑥 + 166,798
�̂� = 0,3106𝑥 + 206,63
b.
c. 𝑟 = 0,449, luego las variables
puntaje de matemática y puntaje
lectura existe una asociación lineal
positiva y baja.
194
CONTROL UNIDAD
1.-
a. Solución al lector.
b. Demostración
∑ ∑ 𝑛𝑖𝑗
𝑓
𝑖=1
𝑐
𝑗=1
= 𝑥1𝑦1 + 𝑥2𝑦2 + ⋯ + 𝑥𝑖𝑦𝑗 + ⋯ + 𝑥𝑓𝑦𝑐
= 𝑛11 + 𝑛22 + ⋯ + 𝑛𝑖𝑗 + ⋯ + 𝑛𝑓𝑐
= 𝑛
Luego,
∑ ∑ 𝑛𝑖𝑗
𝑓
𝑖=1
𝑐
𝑗=1
= 𝑛
c. Demostración
∑ ∑ 𝑓𝑖𝑗
𝑓
𝑖=1
𝑐
𝑗=1
=𝑥1𝑦1 + 𝑥2𝑦2 + ⋯ + 𝑥𝑖𝑦𝑗 + ⋯ + 𝑥𝑓𝑦𝑐
𝑛
=𝑛11 + 𝑛22 + ⋯ + 𝑛𝑖𝑗 + ⋯ + 𝑛𝑓𝑐
𝑛
= 1
Luego,
∑ ∑ 𝑓𝑖𝑗
𝑓
𝑖=1
𝑐
𝑗=1
= 1
d. Demostración
∑ 𝑛𝑖⋅
𝑓
𝑖=1
= 𝑥1 + 𝑥2 + ⋯ + 𝑥𝑖 + ⋯ + 𝑥𝑓
= 𝑛1⦁ + 𝑛2⦁ + ⋯ + 𝑛𝑖⦁ + ⋯ + 𝑛𝑓⦁
= 𝑛
Luego,
∑ 𝑛𝑖⋅
𝑓
𝑖=1
= 𝑛
e. Ídem al anterior.
2.- Solución al lector.
EJERCICIOS TIPO PRUEBA
1.-
a.
b.
Hábito de fumar 𝑛𝑖⦁
Muy fumador 0,133
Fumador 0,266
Fumador esporádico 0,399
No fumador 0,199
195
Tipo de accidente 𝑛⦁𝑗
Muy grave 0,123
Grave 0,247
Lesiones medias 0,266
Leves 0,361
c.
Tipo accidente
M G G L M L 𝑛𝑖⦁
Háb
ito
de
fum
ar
M F 3,8% 1,9% 1,9% 5,7% 13.3%
F 5,7% 7,6% 3,8% 9,5% 26,6%
F E 1,9% 11,4% 15,2% 11,4% 39,9%
N F 0,9% 3,8% 5,7% 9,5% 19,9%
𝑛⦁𝑗 12,3% 24,7% 26,6% 36,1% 99,7%
Interpretación: un 11,4% de los
trabajadores son fumadores esporádicos
que sufrieron accidentes lesiones leves.
Un 7,6% de los trabajadores son
fumadores y sufrieron accidentes graves.
2.-
a. Por lo que podemos notar en la
tablas, las variables estarían
relacionadas linealmente la una con
la otra, lo que podemos confirmar
con el valor de 𝑟.
𝑟 = 0,978.
b. �̂� = 0,362𝑥 + 3,604
c. Con 60 millones en gastos de
publicidad se espera que hayan
25,369 en volumen en ventas de la
empresa. Y para un volumen de
ventas de 20 mil millones se espera
tener gastos en publicidad de 45,198
millones.
d. 𝑟 = 0,978, es decir, la asociación
lineal entre las variables es fuerte y
positiva.
3.-
a.
196
b.
197
c. Los coeficientes de correlación lineal
son:
𝑟 = 0,936
𝑟 = 0,522
𝑟 = 0,616
𝑟 = 0,358
𝑟 = 0,478
𝑟 = 0,936
d. Solución al lector
4.-
Solución al lector
5.-
a. Los corredores que les va bien en los
100 metros también les irá bien en
los 400 metros, pues el coeficiente de
correlación nos indica que las
variables están asociadas fuerte y
positivamente.
b. �̂� = 1,8𝑥 + 39,39
c. Con una marca de 11 segundos en
100 metros se espera que el atleta
marque 59,19 segundos en 400
metros.
6.-
Si sustituimos el valor de 𝑦 de la recta de
regresión de 𝑌 sobre 𝑋,
𝑦 = �̅� +𝑆𝑥𝑦
𝑆𝑥2
⋅ 𝑥 −𝑆𝑥𝑦
𝑆𝑥2
⋅ �̅�
en la recta de regresión de 𝑋 sobre 𝑌,
𝑥 − �̅� =𝑆𝑥𝑦
𝑆𝑦2
⋅ (𝑦 − �̅�)
De ambas expresiones obtenemos:
𝑥 − �̅� =𝑆𝑥𝑦
𝑆𝑦2
⋅ (�̅� +𝑆𝑥𝑦
𝑆𝑥2
⋅ 𝑥 −𝑆𝑥𝑦
𝑆𝑥2
⋅ �̅� − �̅�)
Simplificando y operando, resulta que
𝑥 − �̅� = 𝑥 ⋅𝑆𝑥𝑦
2
𝑆𝑥2 ⋅ 𝑆𝑦
2− �̅� ⋅
𝑆𝑥𝑦2
𝑆𝑥2 ⋅ 𝑆𝑦
2
198
Por último, agrupando términos
semejantes,
𝑥 (1 −𝑆𝑥𝑦
2
𝑆𝑥2 ⋅ 𝑆𝑦
2) = �̅� (1 −
𝑆𝑥𝑦2
𝑆𝑥2 ⋅ 𝑆𝑦
2)
Es decir,
𝑥(1 − 𝑟2) = �̅�(1 − 𝑟2)
Si suponemos que
1 − 𝑟2 = 0
Esto es, si 𝑟2 = 1, entonces, el ajuste es
perfecto y, como sabemos, las dos rectas
de regresión coinciden.
Si, por lo contrario
1 − 𝑟2 ≠ 0
Entonces, dividiendo por esa los dos
miembros de la igualdad se obtiene que 𝑥
es �̅� y, sustituyendo, por ejemplo, en la
recta de regresión de 𝑌 sobre 𝑋 resulta un
valor de 𝑦 igual a �̅�; en definitiva, las
rectas de regresión tienen como punto de
corte (�̅� , �̅�), punto denominado centro de
gravedad.
top related