Click here to load reader
1 UTA Ing. M.B.A William Teneda
UNIVERSIDAD TCNICA DE AMBATO
GUIA DEL MODULO
ESTADISTICA
Ing. M.B.A William Fabin Teneda Llerena
2 UTA Ing. M.B.A William Teneda
CAPITULO I
ESTADIGRAFOS DE POSICION Y
ESTADIGRAFOS DE DISPERSION
I.1 Objetivos
Diferenciar entre los estadgrafos de posicin y los estadgrafos de dispersin.
Demostrar el inters en la aplicacin de los estadgrafos.
Comprender como se desarrollan y se aplica las medidas de tendencia central
[estadgrafos de posicin] y los estadgrafos de dispersin.
I.2 Marco Terico
I.2.1 DISTRIBUCIN DE FRECUENCIAS
La distribucin de frecuencias es un mtodo para organizar y resumir datos. Con este
mtodo los datos que componen una serie se clasifican y ordenan indicndose el
nmero de veces que se repite el valor.
ELABORACIN DE UNA TABLA DE FRECUENCIAS
Variable Discreta.- es necesario familiarizarse con algunos smbolos.
n = tamao muestra
N = tamao poblacin
X i = identificacin de cada valor observado
n i = frecuencia absoluta
h i = frecuencia relativa
N i = frecuencia absoluta acumulada
H i = frecuencia relativa acumulada
3 UTA Ing. M.B.A William Teneda
Y i = indican los valores que toman las variables
y i = marca de clase
m = nmero de valores que toma la variable Yi. Tambin se
considera el nmero de intervalos o marcas de clase en la variable.
Ejercicio.
Supongamos una poblacin constituida por 200 cajas y se desea examinarlas,
determinndose el nmero de piezas defectuosas que contiene cada caja. Por
diferentes razones se desea que la investigacin no sea exhaustiva, es decir
seleccionar una muestra de tamao 20, correspondiendo a una investigacin
parcial.
N = 200 n = 20
El resultado de esta encuesta, se anota a continuacin, siendo X1 la primera
caja examinada y 3 el nmero de piezas defectuosas encontradas en esa caja.
x1= 3 x6= 3 x11= 3 x16= 2
x2= 2 x7= 1 x12= 3 x17= 4
X3= 0 X8= 1 X13= 4 X18= 2
x4= 2 x9= 0 x14= 4 x19= 4
x5= 3 x10= 1 x15= 3 x20= 2
Variable contnua.- debemos conocer
m = nmero de intervalos
c = amplitud del ancho del intervalo
Yi ni hi Ni Hi0 2 0,10 2 0,101 3 0,15 5 0,252 5 0,25 10 0,503 6 0,30 16 0,804 4 0,20 20 1,00
20 1 ---- ----
4 UTA Ing. M.B.A William Teneda
=
Histograma, usado para variables continuas. En el eje OX se sealan los extremos de
los intervalos. Se construyen unos rectngulos de base la amplitud del intervalo y de
altura la frecuencia absoluta.
Polgono de frecuencias, se obtiene uniendo los puntos medios de los segmentos
superiores de los rectngulos del diagrama.
Grfico de sectores, es el resultado de dividir un crculo en sectores circulares de
ngulos proporcionales a las frecuencias absolutas de cada valor de la variable. Para
calcular los grados de cada sector se divide la frecuencia entre el nmero de datos y
se multiplica por 360.Se utiliza para variable discreta y continua.
1.2.2. MEDIDAS DE TENDENCIA CENTRAL [ESTADGRAFOS DE POSICIN]
Estas medidas tienden a ubicarse en el centro del conjunto.
Proporcionan un valor simple y representativo, que resume un gran volumen de
informacin.
1. Media Aritmtica
2. Mediana
3. Moda
4. Media Geomtrica
5. Media Armnica
6. Media Cuadrtica
7. Media Cbica
8. Cuartiles, Deciles y Percentiles
1. Media Artimtica
5 UTA Ing. M.B.A William Teneda
La media aritmtica se puede calcular para datos agrupados y no agrupados.
La media aritmtica de un conjunto de valores x1 , x2, x3,............xn se obtiene
sumando todos los valores y dividiendo por el nmero de datos n.
XI= 1,26 X=
X2=1,75 n
Exi
X3= 1,64 x=
X4= 1,45 n
x1+x2+x3+x4+x5
X5= 1,38 x= 1,25+1,75+1,64+1,45+1,38 = 7,47
5 5
= 1,44
Y1 y2 ni yi yini Ni
2 4 1 3 3 1
4 6 3 5 15 4
6 8 7 7 49 11
8 10 2 9 18 13
10 12 4 11 44 17
Eni= 17 Exiyi= 129
X=
nT
Exini
X= 129
17
= 1,58
2. Mediana
6 UTA Ing. M.B.A William Teneda
De un conjunto ordenado de datos es aquel valor tal que la mitad de los datos
son iguales o inferiores a l y la otra mitad son iguales o superiores.
Si el nmero de datos es pequeo los ordenamos y cogemos el valor central.
Caso 1: Cuando el nmero de datos es impar:
Si los valores son 4,6,4,5,7,3,9. Los ordenamos 3,4,4,5,6,7,9, cmo son 7
datos
cogemos el dato que ocupa el lugar 4 que es 5.
Caso 2: Cuando el nmero de datos es impar:
Si los valores son 4,6,5,7,3,9. Los ordenamos 3,4,5,6,7,9, cmo son 6 datos
cogemos los datos que ocupan el lugar 3 que es 5 y el lugar 4 que es 6. la
mediana es la media de los dos nmeros es este caso 5,5 =(5+6)/2
ejercicios de mediana
Y1 y2 ni yi yini Ni
2 4 1 3 3 1
4 6 3 5 15 4
6 8 7 7 49 11
8 10 2 9 18 13
10 12 4 11 44 17
me = yj-1+c (
Nj
(n/2) Nj -1
me = 6+2 ( 3.5 +4
11
)
me = 6 + 2 +
11
4.5
me = 6.81
3. Moda
La moda de un conjunto de datos es el dato que tiene mayor frecuencia.
El intervalo modal es el de mayor frecuencia absoluta. Cuando tratamos con
datos agrupados antes de definir la moda, se ha de definir el intervalo modal.
7 UTA Ing. M.B.A William Teneda
La moda, cuando los datos estn agrupados, es un punto que divide al
intervalo modal en dos partes de la forma p y c-p, siendo c la amplitud del
intervalo, que verifiquen
que:
Siendo la frecuencia absoluta del intervalo modal las frecuencias absolutas de
los intervalos anterior y posterior, respectivamente, al intervalo modal.
ejercicios de moda
Y1 y2 ni Yi yini Ni
2 4 1 3 3 1
4 6 3 5 15 4
6 8 7 7 49 11
8 10 2 9 18 13
10 12 4 11 44 17
md = yj-1+c (
nj+1+nj-1
(nj+1) )
md = 6+2 ( 2 )
2+8
md = 6 +
5
4
md = 6.8
4. Media Geomtrica
Es considerada como una medida de posicin simbolizada por Mo y su
resultado al ser calculado debe estar comprendido entre la media armnica y la
aritmtica.
8 UTA Ing. M.B.A William Teneda
Sea una distribucin de frecuencias (x , n ). La media geomtrica, que
denotaremos por G. se define como la raz N-sima del producto de los N
valores de la distribucin.
Si los datos estn agrupados en intervalos, la expresin de la media
geomtrica, es la misma, pero utilizando la marca de clase (Xi).
El empleo ms frecuente de la media geomtrica es el de promediar variables
tales como porcentajes, tasas, nmeros ndices. etc., es decir, en los casos en
los que se supone que la variable presenta variaciones acumulativas.
Ventajas e inconvenientes:
- En su clculo intervienen todos los valores de la distribucin.
- Los valores extremos tienen menor influencia que en la media aritmtica.
- Es nica.
- Su clculo es ms complicado que el de la media aritmtica.
Adems, cuando la variable toma al menos un x = 0 entonces G se anula, y si
la variable toma valores negativos se pueden presentar una gama de casos
particulares en los que tampoco queda determinada debido al problema de las
races de ndice par de nmeros negativos.
5. Media Armnica
Se utiliza como una medida de tendencia central para conjunto que consisten
en caja de cambios.
La media armnica, que representaremos por H, se define como sigue:
9 UTA Ing. M.B.A William Teneda
Es la inversa de la media aritmtica de las inversas de los valores de la variable,
responde a la siguiente expresin:
....3
3
21
2
1
1 +++==
xn
xn
xn
n
xn
nH
i
i
Obsrvese que la inversa de la media armnica es la media aritmtica de los
inversos de los valores de la variable. No es aconsejable en distribuciones de
variables con valores pequeos. Se suele utilizar para promediar variables tales
como productividades, velocidades, tiempos, rendimientos, cambios, etc.
Ventajas e inconvenientes:
- En su clculo intervienen todos los valores de la distribucin.
- Su clculo no tiene sentido cuando algn valor de la variable toma valor
cero.
- Es nica.
Relacin entre las medias:
ejercicio de media armnica X1=0,15 M-1 = n = Q 3
X2=0,18 E(/xi) (1/0,15)+(1/0,18)+(1/0,17)
G
X3=0,17 M-1= 0,165
M-1 = n = Q 10
E(/Yi) 0,0614
G
M-1= 162,866
10 UTA Ing. M.B.A William Teneda
6. Media Cuadrtica
La media cuadrtica es igual a la raz cuadrada de la suma de los cuadrados
de los valores dividida entre el nmero de datos:
Esta media como medida de asociacin tiene aplicaciones tanto en ciencias
biolgicas como en medicina.
A veces la variable toma valores positivos y negativos, como ocurre, por
ejemplo, en los errores de medida. En tal caso se puede estar interesado en
obtener un promedio que no recoja los efectos del signo. Este problema se
resuelve, mediante la denominada media cuadrtica. Consiste en elevar al
cuadrado todas las observaciones (as los signos negativos desaparecen), en
obtener despus su media aritmtica y en extraer, finalmente, la raz cuadrada
de dicha media para volver a la unidad de medida original.
ejercicio de media cuadrtica
m2 = Eyi2*ni = 1020
n 20
= 7,4
7. Media Cbica
La media cbica es una medida derivada de la media aritmtica y consiste en
obtener el valor del lado que tiene el cubo media de un conjunto de n cubos.
yi ni Yi*ni Yi2*ni
2
4
6
8
10
2
3
5
6
4
4
12
30
48
40
8
48
180
384
400
1020
11 UTA Ing. M.B.A William Teneda
ejercicio de media cubica X1= 5 X2=6 m3 =
X3=10 5
53+63+103+123+73
X4=12 m3= 8,80
X5=7
8. Cuartiles, Deciles y Percentiles
Los cuartiles son los tres valores de la variable que dividen a un conjunto de
datos Ordenados en cuatro partes iguales.
Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75%
de los datos. Q2 coincide con la mediana.
Los deciles son los nueve valores que dividen la serie de datos en diez partes
iguales. Los deciles dan los valores correspondientes al 10%, al 20%... y al
90% de los datos. D5 coincide con la mediana.
Los percentiles son los 99 valores que dividen la serie de datos en 100 partes
iguales. Los percentiles dan los valores correspondientes al 1%, al 2%... y al
99% de los datos. P50 coincide con la mediana.
I.2.3 ESTADIGRAFOS DE DISPERSION
Se llaman medidas de dispersin aquellas que permiten retratar la distancia de los
valores de la variable a un cierto valor central, o que permiten identificar la
concentracin de los datos en un cierto sector del recorrido de la variable. Se trata
de coeficiente para variables cuantitativas.
1. Varianza
2. Desviacin Tpica
3. Desviacin Media
12 UTA Ing. M.B.A William Teneda
1. Varianza
Varianza: Es la media de los cuadrados de las desviaciones de los datos
respecto a la media.
2. Desviacin Tpica
Desviacin Tpica: Es la raz cuadrada de la varianza. Se calcula aplicando
esta frmula.
3. Desviacin Media
Desviacin media de un conjunto de datos es la media aritmtica de los valores
absolutos de las desviaciones respecto a la media.
13 UTA Ing. M.B.A William Teneda
I.3 Trminos y Conceptos claves
Variable.- una variable es una cantidad sujeta a variacin existen 2 tipos de variables; las cuantitativas y cualitativas.
Dentro de las variables cuantitativas podemos distinguir las variables discretas y las
variables continuas.
a) Variables Discretas .- valores enteros
b) Variables Continuas.- valores fraccionables
Tablas Y Graficas.- la presencia de datos en una investigacin se las puede representar de varias formas que pueden ser: textuales, cuadros o tablas y grficas.
I.4 Preguntas y Problemas i. Las notas de una estudiante han sido 85, 76, 93, 82 y 96. Calcular los
estadgrafos de posicin y de dispersin. ii. Un conjunto de nmeros contiene 6 seises, 7 sietes, 8 ochos, 9 nueves y 10
dieces. Calcular los estadgrafos de posicin y de dispersin. iii. Tres profesores de economa dieron notas medias en sus cursos, con 32, 25 y
17 estudiantes de 79, 74 y 82 puntos, respectivamente. Hallar la puntuacin
media de los tres cursos.
I.5 Bibliografa Complementaria
Robert Pagano. Estadstica Para Las Ciencias Del Comportamiento 7 Edicin.
Editorial Thomson. Impreso En Litograf Nueva poca. Enero 2006, Mxico Df
Estadstica De Gilbert. Editorial Interamericana Impreso En Mxico 1980.
Primera Edicin
Estadstica De Schaum. Segunda Edicin. Editorial Mcgraw Hill.
Ronald E. Walpole, Raymond H. Myers. Probabilidad Y
Estadstica. Editorial: 2007 Pearson Education De Mexico
Jack R. Benjamin. Probabilidad Y Estadistica. Editorial: 1981
McgrawHill Latinoamericana Editores S.A De C.V.
Probabilidad Y Estadistica. William Navidi. Editorial: Mcgraw
Hill/Interamericana Editores S.A De C.V. Edicon 2006.
14 UTA Ing. M.B.A William Teneda
Probabilidad Y Estadistica. Autor: J. Susan Milton Y Jesse C. Arnold. Editorial:
Mcgraw Hill/Interamericana Editores S.A De C.V. Octava Edicin.
Ronald E.; Raymond H. Probabilidad Y Estadstica Para Ingeniera Y Ciencias.
Editorial: Pearson Educacin Printed In Mxico. Ao: Octava Edicin 2007.
Ciro Matnez Bencardino. Estadstica Bsica, Probabilidad Y Estadstica.
Editorial: Ecoe Ediciones. Quinta Edicin ,Agosto De 1990
15 UTA Ing. M.B.A William Teneda
CAPITULO II
REGRESION Y CORRELACION
2.1Objetivos
Emplear adecuadamente los diferentes tipos de regresiones.
Dominar la utilizacin de las regresiones.
2.2Marco Terico
REGRESIONES
La regresin es una tcnica estadstica utilizada para simular la relacin existente
entre dos o ms variables. Por lo tanto se puede emplear para construir un modelo
que permita predecir el comportamiento de una variable dada.
La regresin es muy utilizada para interpretar situaciones reales, pero comnmente se
hace de mala forma, por lo cual es necesario realizar una seleccin adecuada de las
variables que van a construir las ecuaciones de la regresin, ya que tomar variables
que no tengan relacin en la prctica, nos arrojar un modelo carente de sentido, es
decir ilgico.
Segn sea la dispersin de los datos (nube de puntos) en el plano cartesiano, pueden
darse alguna de las siguientes relaciones, Lineal, Logartmica, Exponencial,
Cuadrtica, entre otras.
Regresin Lineal El objetivo de la tcnica de regresin es establecer la relacin estadstica que existe
entre la variable dependiente (Y) y una o ms variables independientes (X1, X2, Xn).
Para poder realizar esto, se postula una relacin funcional entre las variables. Que en
la prctica es la relacin lineal:
= b0 + b1x1 + bnxn
donde los coeficientes b0 y b1, bn, son los parmetros que definen la variacin
promedio de y, para cada valor de x..
16 UTA Ing. M.B.A William Teneda
El anlisis de regresin se utiliza para fines de prediccin. Y el anlisis de correlacin
se utiliza para medir la fuerza de la asociacin entre las variables cuantitativas.
- El parmetro b0, conocido como la ordenada en el origen, nos indica cunto es Y
cuando X = 0. El parmetro b1, conocido como la pendiente, nos indica cunto
aumenta Y por cada aumento en X.
- La tcnica consiste en obtener estimaciones de estos coeficientes a partir de una
muestra de observaciones sobre las variables Y y X.
REGRESIN POLINOMIAL
En situaciones donde la relacin funcional entre la respuesta Y y la variable independiente x no se puede aproximar de manera adecuada mediante una relacin lineal, es, algunas veces, posible obtener un ajuste razonable considerando una relacin polinomial. Es decir, podemos ajustar el conjunto de datos a una relacin funcional de la forma:
Y = Bo + Box + B2x2 + Brxr + e
Donde B0, B1,, Br son coeficientes de regresin que tienen que estimarse. Si los datos constan de los n pares (.xi, Yi), i= 1,..,n, entonces los estimadores de mnimos cuadrados de, B0,.....,Br llammoslos BO,..., Br son aquellos valores que minimizan
Para determinar estos valores, obtenemos las derivadas parciales de la suma de cuadrados anterior, respecto a BO,... Br, y luego, igualamos a cero con el objetivo de determinar los valores minimizantes. Al hacer esto y reordenando despus las ecuaciones resultantes, obtenemos que los estimadores de mnimos cuadrados, BO,BI,Br satisfacen el conjunto de r + 1 ecuaciones lineales, llamadas ecuaciones normales.
17 UTA Ing. M.B.A William Teneda
Al ajustar una funcin polinomial a un conjunto de pares de datos, con
frecuencia es posible determinar el grado necesario del polinomio mediante un estudio del diagrama de dispersin. Que queremos enfatizar que siempre se debe usar el menor grado posible que parezca describir los datos adecuadamente. (As, por ejemplo, aunque normalmente es posible encontrar un polinomio de grado n que pase por todos los n pares (xi, Yi), i=1,,n, sera difcil tener mucha confianza en tal ajuste.)
- Resulta muy arriesgado, an ms que en el caso de la regresin lineal, usar un polinomio ajustado para predecir el valor de una respuesta a un nivel de entrada x0 que este lejos de los niveles de entrada xi, i=1,,n usados para encontrar el polinomio de ajuste. (El polinomio de ajuste puede ser vlido slo en una regin alrededor de las xi, i=1,,n y no incluir a x0).
Regresin Lineal Mltiple
Muchas aplicaciones del anlisis de regresin involucran situaciones donde se
tiene ms de una variable de regresin. Un modelo de regresin que contiene ms
de un regresor recibe el nombre de modelo de regresin mltiple
Como ejemplo, supngase que la vida eficaz de una herramienta de corte depende
de la velocidad de corte y del ngulo de la herramienta. Un modelo de regresin
mltiple que puede describir esta relacin es el siguiente
= + 11 + 22 +
18 UTA Ing. M.B.A William Teneda
FORMULAS PARA EL CALCULO DE REGRESIONES
1. REGRESION LINEAL: = 0 + 1 y = 0 + 1 1 = ()()2 () 2 0 = 1 2 = 0 + 1 1 () 2
( 2) 1 () 2 = 0 + 1 = 0 + 1 2 x
2. REGRESION LOGARITMICA: = 0 + 1
1 = ( )( )( ) 2( ) 2 y 0 = 1 2 = 0 +1 ( )1( ) 2
(2)1
() 2 = 0 + 1 = 0 + 1 () = 0 + 1 2
x
19 UTA Ing. M.B.A William Teneda
3. REGRESION EXPONENCIAL: = 0 + 1 y
1 = ( )()( ) 2() 2 = 0 = 1 = 0 + 1 2 = 0 + 1 () 1 ( ) 2
( 2) 1 ( ) 2 = 0 + 1 () = 0 + 1 2 x
4. REGRESION POTENCIAL: = 0 + 1 y
1 = ( )( )( ) 2( ) 2 = 0 = 1 = 0 + 1 2 = 0 + 1 () 1 ( ) 2
( 2) 1 ( ) 2 = 0 + 1 ()() = 0 + 1 2
5. REGRESION CUADRATICA: = 0 + 1 + 22
1) = 0 + 1 + 2 2 2) = 0 + 1 2 + 2 3 3) 2 = 0 2 + 1 3 + 2 4
2 = 0 + 1 + 2 2 1 () 2(2) 1 () 2
20 UTA Ing. M.B.A William Teneda
6. REGRESION CUBICA: = 0 + 1 + 22 + 33 1) = 0 + 1 + 2 2 + 3 3 2) = 0 + 1 2 + 2 3 + 3 4 3) 2 = 0 2 + 1 3 + 2 4 + 3 5 4) 3 = 0 3 + 1 4 + 2 5 + 3 6
2 = 0 + 1 + 2 2 + 3 3 1 () 2(2) 1 () 2
7. REGRESION MULTIPLE: 1) = 0 + 1 1 + 2 2 2) 1 = 0 1 + 1 12 + 2 12 3) 2 = 0 2 + 1 12 + 2 2 2
2 = 0 + 1 + 2 2 1 () 2(2) 1 () 2
2.3Trminos y Conceptos claves
Interpretacin de los Coeficientes de Regresin:
Interpretacin del intercepto :
Indica el valor promedio de la variable de respuesta Y cuando X es cero. Si se tiene
certeza de que la variable predictoria X no puede asumir el valor 0, entonces la
interpretacin no tiene sentido.
Interpretacin de la pendiente :
Indica el cambio promedio en la variable de respuesta Y cuando X se incrementa
en una unidad.
Anlisis de Residuales
Un residual es la diferencia entre el valor observado y el valor estimado por
la lnea de regresin ,
El residual puede ser considerado como el error aleatorio observado.
21 UTA Ing. M.B.A William Teneda
2.4 Problemas
Se desea desarrollar un modelo de regresin polinmica para predecir la temperatura ambiente para la calefaccin domstica durante el mes de enero en funcin del consumo de combustible ambiente.
Observacin Temperatura
Ambiente Consumo Mensual De
Petrleo Cantidad De Aislamiento
(Diaria Promedio) Para Calefaccin [Galones] En El tico
[F] [Pulgadas]
1 40 27,5 3
2 27 36,4 3
3 40 16,4 10
4 73 4,1 6
5 64 9,4 6
6 34 23,1 6
7 9 36,7 6
Regresin Cbica
X1 Y Y2 X1Y X21Y X31Y
27,5 40 1600 1100 30250 831875
36,4 27 729 982,8 35773,92 1302171
16,4 40 1600 656 10758,4 176437,8
4,1 73 5329 299,3 1227,13 5031,233
9,4 64 4096 601,6 5655,04 53157,38
23,1 34 1156 785,4 18142,74 419097,3
36,7 9 81 330,3 12122,01 444877,8
153,6 287 14591 4755,4 113929,24 3232647
22 UTA Ing. M.B.A William Teneda
X21 X31 X41 X51 X61
756,25 20796,875 571914,063 15727636,72 432510009,8
1324,96 48228,544 1755519 63900891,66 2325992456
268,96 4410,944 72339,4816 1186367,498 19456426,97
16,81 68,921 282,5761 1158,56201 4750,104241
88,36 830,584 7807,4896 73390,40224 689869,7811
533,61 12326,391 284739,632 6577485,502 151939915,1
1346,89 49430,863 1814112,67 66577935,07 2443410217
4335,84 136093,122 4506714,92 154044865,4 5374003645
Frmulas
321
bbbbo
=
YXYX
XYY
31
21
Matriz Inversa
61
51
41
31
51
41
31
21
41
31
211
31
211
xxxxxxxxxxxxxxxn
=
3232647,12113929,24
4755,4287
53740036454154044865,64506714,91136093,1224154044865,64506714,91136093,1224335,8464506714,91136093,1224335,84153,6
136093,1224335,84153,67
321
bbbbo
07-2,08942E05-1,30796E-0,000225760,00091455-05-1,30796E-80,000830680,01463819-0,060961830,0002257610,01463819-0,266422941,16835825-
0,00091455-60,060961791,16835825-5,80046665
=
321
bbbbo
3232647,12113929,24
4755,4287
23 UTA Ing. M.B.A William Teneda
7902272251 -0,003591836379108 0,243669352
7294009 -6,27687081670896 97,6351505
====
bbbbo
Ecuacin Cbica
bo X b1 X b2 X b3 Y 23 +++=
Y = -0,0036X3 + 0,2437X2 - 6,2769X+ 97,635
Coeficiente De Determinacin Y De Correlacin
22
232
2
)(1)(
)(1321
+++=
Yn
Y
Yn
YXbYXbXYbYboR
28246127732555,043672 =R
85438150,904760502 =R
72785720,95118899=R
Grfica:
0
20
40
60
80
0 10 20 30 40
Consumo De Combustible [Galones]
Tem
pera
tura
Pro
med
io
Diar
ia [
F]
24 UTA Ing. M.B.A William Teneda
Qu temperatura debera tener el ambiente si el consumo de tuviera 35 galones para el modelo utilizado en el literal anterior?
Y = -0,0036X3 + 0,2437X2 - 6,2769X+ 97,635
Y= 22,4378184793661 F
Regresin Cuadrtica
X1 Y Y2 X1Y X21Y X21 X31 X41
27,5 40 1600 1100 30250 756,25 20796,875 571914,063
36,4 27 729 982,8 35773,92 1324,96 48228,544 1755519
16,4 40 1600 656 10758,4 268,96 4410,944 72339,4816
4,1 73 5329 299,3 1227,13 16,81 68,921 282,5761
9,4 64 4096 601,6 5655,04 88,36 830,584 7807,4896
23,1 34 1156 785,4 18142,74 533,61 12326,391 284739,632
36,7 9 81 330,3 12122,01 1346,89 49430,863 1814112,67
153,6 287 14591 4755,4 113929,24 4335,84 136093,122 4506714,92
Formulas
41
31
21
31
211
211
xxxxxxxxn
21
bbbo
=
YXYX
Y
21
1
4506714,92136093,1224335,84136093,1224335,84153,6
4335,84153,67
21
bbbo
=
113929,244755,4
287
25 UTA Ing. M.B.A William Teneda
Matriz Inversa
Ecuacin Cuadrtica
boXbXbY ++= 12 2
81,913 2,3958X - 0,0188X 2 +=Y
Coeficiente De Determinacin Y De Correlacin
22
22
2
)(1)(
)(121
++=
Yn
Y
Yn
YXbXYbYboR
28246645952493,296282 =R
56395020,882895282 =R
71661540,93962507=R
Grafico:
05-1,192E0,00050563-90,003711740,00050563-0,0224841330,18017899-0,003711750,18017899-71,79742071
113929,244755,4
287
=
21
bbbo
564475910,0188209222991347-2,395816317530581,9132665
===
bbbo
0
20
40
60
80
0 10 20 30 40
Consumo De Combustible [Galones]
Tem
pera
tura
Pro
med
io
Diar
ia [
F]
26 UTA Ing. M.B.A William Teneda
El conocido urbanista siente que hay una relacin entre una segunda variable independiente la cantidad de aislamiento. Establezca la regresin mltiple y analice los datos
Regresin Mltiple
X1 X2 Y X1X2 X1Y X2Y X21 X22
27,5 3 40 82,5 1100 120 756,25 9
36,4 3 27 109,2 982,8 81 1324,96 9
16,4 10 40 164 656 400 268,96 100
4,1 6 73 24,6 299,3 438 16,81 36
9,4 6 64 56,4 601,6 384 88,36 36
23,1 6 34 138,6 785,4 204 533,61 36
36,7 6 9 220,2 330,3 54 1346,89 36
153,6 40 287 795,5 4755,4 1681 4335,84 262
Frmulas
1. =+ nboYXbXb 21 21
2. n
YXYX
nXX
XXbnX
Xb =
+
11
2121
212
1 2)(
1
3. n
YXYX
nX
Xbn
XXXXb =
+
22
222
2121
21
)(21
1. o7-2872401153,6 bbb =+
2. [ ] [ ] -1542,282,2142857-2965,4171431 =+ bb
3. [ ] [ ] 4133,4285714282,2142857-1 =+ bb
27 UTA Ing. M.B.A William Teneda
2. 8-1,59744412 0,08515934 -1 =bb
3. 0,498696792 0,40660295 1 =+ bb
-1,098747420,32144361 =b
101,972188-1,888532816-3,41816522
===
bobb
Ecuacin Mltiple
Y = bo b1X1 + b2X2
Y = 101,9721 1,8885X1 -3,41816X2
Coeficiente De Determinacin Y De Correlacin
22
221
2
)(1)(
)(121
++=
Yn
Y
Yn
YXbYXbYboR
28242772,350632 =R
0,981710562 =R
0,99081308=R
28 UTA Ing. M.B.A William Teneda
2.5 Bibliografa Complementaria
Robert Pagano. Estadstica Para Las Ciencias Del Comportamiento 7 Edicin.
Editorial Thomson. Impreso En Litograf Nueva poca. Enero 2006, Mxico Df
Estadstica De Gilbert. Editorial Interamericana Impreso En Mxico 1980.
Primera Edicin
Estadstica De Schaum. Segunda Edicin. Editorial Mcgraw Hill.
Ronald E. Walpole, Raymond H. Myers. Probabilidad Y
Estadstica. Editorial: 2007 Pearson Education De Mexico
Jack R. Benjamin. Probabilidad Y Estadistica. Editorial: 1981
McgrawHill Latinoamericana Editores S.A De C.V.
Probabilidad Y Estadistica. William Navidi. Editorial: Mcgraw
Hill/Interamericana Editores S.A De C.V. Edicon 2006.
Probabilidad Y Estadistica. Autor: J. Susan Milton Y Jesse C. Arnold. Editorial:
Mcgraw Hill/Interamericana Editores S.A De C.V. Octava Edicin.
Ronald E.; Raymond H. Probabilidad Y Estadstica Para Ingeniera Y Ciencias.
Editorial: Pearson Educacin Printed In Mxico. Ao: Octava Edicin 2007.
Ciro Matnez Bencardino. Estadstica Bsica, Probabilidad Y Estadstica.
Editorial: Ecoe Ediciones. Quinta Edicin ,Agosto De 1990.
Estadistica de Inferencia. Hctor Anbal Saltos.
29 UTA Ing. M.B.A William Teneda
CAPITULO III
INTRODUCCION A LAS PROBABILIDADES
3.1 Objetivos
Aplicar las probabilidades en ejercicios prcticos
Dominar el empleo de la Distribucin normal, Binomial y Poisson .
Explicar y predecir procesos reales que se presentan en la naturaleza y la
tecnologa con la ayuda de la estadstica para resolver problemas inherentes a
la ingeniera civil y mecnica.
3.2 Marco Terico
PROBABILIDAD
Probabilidad de un suceso es el nmero al que tiende la frecuencia relativa
asociada al suceso a medida que el nmero de veces que se realiza el
experimento crece.
P(X) =
NUMERO DE SUCESO POSIBLES
NUMERO DE EXITOS
TABLA DE CONTINGENCIA El procedimiento Tablas de contingencia crea tablas de clasificacin doble y
mltiple y, adems, proporciona una serie de pruebas y medidas de asociacin
para las tablas de doble clasificacin. La estructura de la tabla y el hecho de
que las categoras estn ordenadas o no determinan las pruebas o medidas
que se utilizaban.
Los estadsticos de tablas de contingencia y las medidas de asociacin slo se
calculan para las tablas de doble clasificacin. Si especifica una fila, una
columna y un factor de capa (variable de control), el procedimiento Tablas de
contingencia crea un panel de medidas y estadsticos asociados para cada
valor del factor de capa (o una combinacin de valores para dos o ms
variables de control). Por ejemplo, si sexo es un factor de capa para una tabla
de casado (s, no) en funcin de vida (vida emocionante, rutinaria o aburrida),
los resultados para una tabla de doble clasificacin para las mujeres se
30 UTA Ing. M.B.A William Teneda
calculan de forma independiente de los resultados de los hombres y se
imprimen en paneles uno detrs del otro.
ANALISIS COMBINATORIO
Combinacin
Los coeficientes binomiales o combinaciones son una serie de nmeros
estudiados en combinatoria que indican el nmero de formas en que se pueden
extraer subconjuntos a partir de un conjunto dado. Sin embargo, dependiendo
del enfoque que tenga la exposicin, se suelen usar otras definiciones
equivalentes.
Ejercicios De Combinacin
En una clase de 35 alumnos se quiere elegir un comit formado por tres
alumnos. Cuntos comits diferentes se pueden formar?
C 335 = 35*34*33
3*2*1
= 6545
A una reunin asisten 10 personas y se intercambian saludos entre todos.
Cuntos saludos se han intercambiado?
C 210 = 10*9
2
= 45
En
Permutacin matemticas, dado un conjunto finito con todos sus elementos diferentes, llamamos
permutacin a cada una de las posibles ordenaciones de los elementos de dicho
conjunto.
Por ejemplo, en el conjunto {1,2,3}, cada ordenacin posible de sus elementos,
sin repetirlos, es una permutacin. Existe un total de 6 permutaciones para
estos elementos: "1,2,3", "1,3,2", "2,1,3", "2,3,1", "3,1,2" y "3,2,1".
La nocin de permutacin suele aparecer en dos contextos:
Como nocin fundamental de combinatoria, centrndonos en el
problema de su recuento.
En teora de grupos, al definir nociones de simetra.
31 UTA Ing. M.B.A William Teneda
Ejercicios De Permutaciones
Cuntos nmeros de 5 cifras diferentes se puede formar con los dgitos: 1, 2,
3, 4, 5.?
m = 5 n = 5
P5= 5! = 5*4*2*3*1 = 120
Con las cifras 2, 2, 2, 3, 3, 3, 3, 4, 4; cuntos nmeros de nueve cifras se
pueden formar?
m = 9 a = 3 b = 4 c = 2 a + b + c = 9
S entran todos los elementos. S importa el orden. S se repiten los elementos.
ESPACIO MUESTRAL Y SUCESOS
Experimentos, espacios mustrales y sucesos La teora de las probabilidades trata formalmente de experimentos y de sus resultados donde el trmino experimento se
usa en el sentido ms general. Se denomina espacio muestral la coleccin de todos los
posibles resultados de un experimento. Los elementos del conjunto S de este espacio
se denominan puntos muestrales, cada uno de ellos asociado con uno y slo un
resultado distinto. La precisin para distinguir resultados es cosa de criterio y
depender en la prctica de la utilizacin que se har del modelo.
Ejemplo. Un experimento consiste en lanzar una moneda y despus lanzarla una segunda vez si sale cara. Si sale cruz en el primer lanzamiento, entonces se lanza un dado una vez.
Para listar los elementos del espacio muestral que proporcione la mayor informacin,
construimos el diagrama de rbol de la figura 2.1. Las diversas trayectorias a lo largo de
las ramas del rbol dan los distintos puntos mustrales. Al comenzar con la rama superior
izquierda y movernos a la derecha a lo largo de la primera trayectoria, obtenemos el punto
muestral HH, que indica la posibilidad de que ocurran caras en dos lanzamientos sucesivos
de la moneda. Asimismo, el punto muestral T3 indica la posibilidad.
32 UTA Ing. M.B.A William Teneda
VALOR ESPERADO O ESPERANZA Si P es la probabilidad de xito de un suceso en un solo ensayo, el numero
esperado o esperanza de ese suceso en N ensayos, estar dado por el producto
de N y la probabilidad de xito P.
E = n.p(x)
Ejemplo.
En el lanzamiento 900 veces de dos dados, Cul es la esperanza de que la suma
de sus caras de un valor menor de 6.?
Probabilidad de xito de un solo ensayo.
(1,1) (1,2) (2,1) (2,2) (2,3) (3,2) (3,1) (1,3) (4,1) (4,4)
p(x): 10/36 n=900
E=np=900*(10/36)=9000/36= 250
La esperanza o valor esperado es de que 250 de los 900 lanzamientos, la
suma de sus caras sea menor de 6
DISTRIBUCION BINOMIAL
Procesos de Bernoulli: Un proceso de Bernoulli es una serie de n experimentos
aleatorios que verifican:
Cada experimento tiene dos resultados posibles, que se llaman xito y fracaso.
La probabilidad p de xito es la misma en cada experimento, y esta
probabilidad no se ve afectada por el conocimiento de los resultados anteriores.
La probabilidad q de fracaso viene dada por q = 1 - p.
33 UTA Ing. M.B.A William Teneda
Ejemplos :
Una moneda lanzada al aire 15 veces. Los dos resultados posibles son cara y
cruz. La probabilidad de cara en un lanzamiento es 1/2
Se pregunta a 200 alumnos de de un Instituto de Enseanza Secundaria si
estudian Francs. Los dos resultados posibles son s y no. Si se considera
xito la respuesta s, la probabilidad p de xito indica la proporcin de
estudiantes del Instituto que responden s (estudian francs, pues suponemos
que no mienten).
Tirar un dado de seis caras 10 veces y considerar que el resultado de una
tirada, es que salga un nmero par o un nmero impar. Los resultados posibles
en este caso son par e impar.
El espacio muestral, cada uno de los sucesos y la probabilidad de que ocurran,
en un proceso de Bernoulli, aparecen muy ntidamente cuando se construye un
rbol de probabilidades del proceso.
Por ejemplo vamos a construir el rbol de probabilidades de un proceso de
Bernoulli de tres experimentos:
El espacio muestral del proceso est formado por cada uno de los caminos del
rbol de probabilidades. La probabilidad de un camino, por ejemplo, del camino
: EFE es :
Si en un proceso de Bernouilli asignamos el valor 1 al xito y 0 al fracaso y
consideramos el valor Sj , suma de todos los valores de un resultado concreto
(un camino) con j xitos ; la probabilidad que corresponde a cada valor de la
variable Sj es :
34 UTA Ing. M.B.A William Teneda
Ejercicios De Distribucin Binomial
La probabilidad de xito de una determinada vacuna es 0,72. Calcula la
probabilidad de a que una vez administrada a 15 pacientes:
a) Ninguno sufra la enfermedad
b) Todos sufran la enfermedad
c) Dos de ellos contraigan la enfermedad
Solucin :
Se trata de una distribucin binomial de parmetros B(15, 0'72)
DISTRIBUCIN DE POISSON
En teora de probabilidad y estadstica, la distribucin de Poisson es una
distribucin de probabilidad discreta. Expresa la probabilidad de un nmero k
de eventos ocurriendo en un tiempo fijo si estos eventos ocurren con una tasa
media conocida, y son independientes del tiempo desde el ltimo evento.
La distribucin fue descubierta por Simon-Denis Poisson (17811840) que
public, junto con su teora de probabilidad, en 1838 en su trabajo Recherches
35 UTA Ing. M.B.A William Teneda
sur la probabilit des jugements en matires criminelles et matire civile
("Investigacin sobre la probabilidad de los juicios en materias criminales y
civiles"). El trabajo estaba enfocado en ciertas variables aleatorias N que
cuentan, entre otras cosas, un nmero de ocurrencias discretas (muchas veces
llamadas "arribos") que tienen lugar durante un intervalo de tiempo de duracin
determinada. Si el nmero esperado de ocurrencias en este intervalo es ,
entonces la probabilidad de que haya exactamente k ocurrencias (siendo k un
entero no negativo, k = 0, 1, 2, ...) es igual a:
dnde
e es el base del logaritmo natural (e = 2.71828...),
k! es el factorial de k,
k es el nmero de ocurrencias de un evento,
es un nmero real positivo, equivalente al nmero esperado de
ocurrencias durante un intervalo dado. Por ejemplo, si los eventos
ocurren de media cada 4 minutos, y se est interesado en el nmero de
eventos ocurriendo en un intervalo de 10 minutos, se usara como
modelo una distribucin de Poisson con = 2.5.
Ejercicios De Distribucin De Poisson
1. Si un banco recibe en promedio 6 cheques sin fondo por da, cules
son las probabilidades de que reciba, a) cuatro cheques sin fondo en un da
dado, b) 10 cheques sin fondos en cualquiera de dos das consecutivos?
Solucin:
a) x = variable que nos define el nmero de cheques sin fondo que llegan al
banco en un da cualquiera = 0, 1, 2, 3, ....., etc, etc.
l = 6 cheques sin fondo por da
e = 2.718
36 UTA Ing. M.B.A William Teneda
b)
x= variable que nos define el nmero de cheques sin fondo que llegan al banco
en dos das consecutivos = 0, 1, 2, 3, ......, etc., etc.
l = 6 x 2 = 12 cheques sin fondo en promedio que llegan al banco en dos das
consecutivos
Nota: l siempre debe de estar en funcin de x siempre o dicho de otra forma,
debe hablar de lo mismo que x.
2. En la inspeccin de hojalata producida por un proceso electroltico
continuo, se identifican 0.2 imperfecciones en promedio por minuto. Determine
las probabilidades de identificar a) una imperfeccin en 3 minutos, b) al menos
dos imperfecciones en 5 minutos, c) cuando ms una imperfeccin en 15
minutos.
Solucin:
a) x = variable que nos define el nmero de imperfecciones en la hojalata
por cada 3 minutos = 0, 1, 2, 3, ...., etc., etc.
l = 0.2 x 3 =0.6 imperfecciones en promedio por cada 3 minutos en la hojalata
b) x = variable que nos define el nmero de imperfecciones en la hojalata
por cada 5 minutos = 0, 1, 2, 3, ...., etc., etc.
l = 0.2 x 5 =1 imperfeccin en promedio por cada 5 minutos en la hojalata
37 UTA Ing. M.B.A William Teneda
=1-(0.367918+0.367918) = 0.26416
c) x = variable que nos define el nmero de imperfecciones en la hojalata
por cada 15 minutos = 0, 1, 2, 3, ....., etc., etc.
l = 0.2 x 15 = 3 imperfecciones en promedio por cada 15 minutos en la hojalata
= 0.0498026 + 0.149408 = 0.1992106
.
DISTRIBUCIN NORMAL
La distribucin normal fue reconocida por primera vez por el francs Abraham
de Moivre (1667-1754). Posteriormente, Carl Friedrich Gauss (1777-1855)
elabor desarrollos ms profundos y formul la ecuacin de la curva; de ah
que tambin se la conozca, ms comnmente, como la "campana de Gauss".
La distribucin de una variable normal est completamente determinada por
dos parmetros, su media y su desviacin estndar, denotadas generalmente
por y .
Al igual que ocurra con un histograma, en el que el rea de cada rectngulo es
proporcional al nmero de datos en el rango de valores correspondiente si, tal y
como se muestra en la Figura 2, en el eje horizontal se levantan
perpendiculares en dos puntos a y b, el rea bajo la curva delimitada por esas
lneas indica la probabilidad de que la variable de inters, X, tome un valor
cualquiera en ese intervalo. Puesto que la curva alcanza su mayor altura en
38 UTA Ing. M.B.A William Teneda
torno a la media, mientras que sus "ramas" se extienden asintticamente hacia
los ejes, cuando una variable siga una distribucin normal, ser mucho ms
probable observar un dato cercano al valor medio que uno que se encuentre
muy alejado de ste.
Propiedades de la distribucin normal:
La distribucin normal posee ciertas propiedades importantes que conviene
destacar:
1. Tiene una nica moda, que coincide con su media y su
mediana.
2. La curva normal es asinttica al eje de abscisas. Por ello,
cualquier valor entre y es tericamente posible. El
rea total bajo la curva es, por tanto, igual a 1.
3. Es simtrica con respecto a su media . Segn esto, para
este tipo de variables existe una probabilidad de un 50% de
observar un dato mayor que la media, y un 50% de observar
un dato menor.
4. La distancia entre la lnea trazada en la media y el punto de
inflexin de la curva es igual a una desviacin tpica ( ).
Cuanto mayor sea , ms aplanada ser la curva de la
densidad.
5. El rea bajo la curva comprendido entre los valores situados
aproximadamente a dos desviaciones estndar de la media
es igual a 0.95. En concreto, existe un 95% de posibilidades
de observar un valor comprendido en el intervalo
.
6. La forma de la campana de Gauss depende de los
parmetros y (Figura 3). La media indica la posicin de
la campana, de modo que para diferentes valores de la
grfica es desplazada a lo largo del eje horizontal. Por otra
parte, la desviacin estndar determina el grado de
apuntamiento de la curva. Cuanto mayor sea el valor de ,
ms se dispersarn los datos en torno a la media y la curva
ser ms plana. Un valor pequeo de este parmetro indica,
39 UTA Ing. M.B.A William Teneda
por tanto, una gran probabilidad de obtener datos cercanos al
valor medio de la distribucin.
Ejemplo 1:
Utilizando la tabla del rea bajo la curva normal, plantearemos algunos problemas que
servirn de modelo.
a.- para Z = 1.5 y Z = -.1.4
Z = 1.5 la tabla da : 0.4332
Z = 1.4 la tabla da : 0.4192
P(-1.4 < Z < 1.5) = 0.4332+0.4192 = 0.8524
P = 85.24%
b.- si se plantea P( Z < 1.5 corresponden al
siguiente grfico:
0.5000+0.4232 = 0.9332 = 93.32%
40 UTA Ing. M.B.A William Teneda
c.- otro problema seria P(Z > 1.5) = ?
0.5000-0.4332 = 0.0668 = 6.68%
DISTRIBUCIONES t DE STUDENT
El lector sabe cmo hacer deducciones acerca de la mayora de la poblacin si
cabe suponer que la distribucin muestral de las medias es normal. Sin
embargo, cabe preguntarse qu puede hacerse si se desconoce y n es
pequea, de modo que no puede hacerse esta suposicin de normalidad.
Contestaremos a esta pregunta en el presente captulo. Se encontrar una
familia de distribuciones t(una distinta para cada valor de n), pero no se toma,
porque pronto se descubrir que, conforme n aumenta, la distribucin t
correspondiente se asemeja mucho a la distribucin normal, e incluso cuando n
es pequea, se aplica una distribucin tefe la misma manera en que se hace
con una distribucin normal.
Se aprender cundo utilizar puntuaciones i y cundo utilizar puntuaciones z y
cmo emplear puntuaciones t, para una media de la poblacin y para
diferencias en las medias de dos poblaciones. Por ltimo, se descubrir cmo
tratar puntuaciones apareadas en muestras que no son independientes.
Caractersticas De Las Distribuciones t
Las distribuciones t de Student tienen las siguientes caractersticas:
1. No hay slo una distribucin t sino una distribucin distinta para cada valor den. Hay una curva normal estndar, y un cuadro de una pgina puede dar
reas debajo de esta curva para la mayor parte de los valores de z que nos
41 UTA Ing. M.B.A William Teneda
interesan. Hay toda una familia de curvas t "estndar". Si se formara un cuadro
para las reas debajo de la curva t para cada n (equivalente al cuadro para las
reas debajo de la curva normal estndar), se necesitara todo un volumen. Los
cuadros t sern muy abreviados.
2. Cada curva t es simtrica a los lados de 0. E-lo significa que la mitad derecha de la curva t tiene este aspecto
Y la mitad izquierda es una imagen en espejo; la curva entera tendr este
aspecto:
A causa de lo anterior, la media de toda distribucin f es 0.
3. El punto ms alto de la curva ocurre cuando t = 0.
4. Al aumentar n, la curva t se acerca cada vez ms a la curva normal. Es fcil advertir lo anterior considerando algunas grficas superpuestas:
Si n es de 30, o ms, la distribucin t y la distribucin normal estndar estn lo
suficientemente cercanas de modo que las reas abajo de esta ltima pueden
utilizarse como aproximacin a las reas debajo de la primera. Esta cercana
42 UTA Ing. M.B.A William Teneda
de las curvas f y z para valores altos de n es lo que justifica el empleo de la
ecuacin s/Vn como aproximacin de x cuando n es grande y se desconoce
5. Cada distribucin t es una distribucin de probabilidad; esto es: el rea debajo de toda la curva es una, y la probabilidad de que una puntuacin t est
entre a y b es igual a rea debajo de la curva entre las lneas t = a y t = b.
CUANDO SE USA UNA DISTRIBUCIN t?
La distribucin t se usa en las siguientes circunstancias:
a) La poblacin tiene distribucin normal y,
b) Se desconoce o- (pero se conoce s o puede calcularse) y
c) n 30.
Si la poblacin no tiene distribucin normal, se cometer un error. Qu tan
grande es el error? Depende de qu tan lejos est la poblacin de la
distribucin normal. Si es casi normal, el error ser pequeo. Si est muy lejos
de ser normal, la distribucin t es casi intil. En la prctica, el problema es que
a menudo se desconoce si la poblacin sigue o no una curva normal.
GRADOS DE LIBERTAD
Cmo se usa una distribucin t?
Antes de continuar, debemos desviarnos un momento para explicar los grados
de libertad.
Imaginemos tres nios que juegan un juego muy sencillo; a saber: tres cartas
estn marcadas, 0, 10 y 20 respectivamente. Se barajan las cartas y cada nio
por turno toma una. Jaime es impulsivo y toma una carta en primer lugar; tiene
10 puntos. Mara elige en seguida y obtiene 0. Toms toma la ltima carta y
debe tener 20 puntos. Sin embargo, si Jaime sac la carta 0 y Mara la carta
20, Toms sacar la carta 10. El punto es que, una vez que dos nios han
elegido su carta, la tercera est fija. Dos de los nios eligieron libremente: hay
dos grados de libertad.
43 UTA Ing. M.B.A William Teneda
Sin puntuaciones tienen media X, n -1 puede elegirse libremente y la ltima es
regida; hay n -1 grados de libertad.
Para encontrar un intervalo de confianza o poner a prueba una hiptesis acerca
de la media valindose de la distribucin f para una muestra de dimensin n, el
nmero de grado de libertad es n - 1. La letra D se utiliza para denotar el
nmero de grados de libertad.
D = n - 1
DISTRIBUCION JI CUADRADO En primer lugar, conzcase la letra griega x (ji); no hay equivalente en
castellano, pero fonticamente corresponde a ji. La veremos nicamente en la
forma x2 y nos referiremos a distribuciones de ji cuadrada o pruebas de ji
cuadrada.
Se han conocido varias familias de distribuciones de probabilidad; a saber:
distribuciones binomial, normal y. Ahora se conocer otra familia de
distribuciones de probabilidad; al igual que con las distribuciones t, habr una
distribucin x2 diferente para cada nmero de grados de libertad. Antes de
conocer a fondo una distribucin x2 veamos un problema en el cual se necesita.
Ejemplo 1. Estudios efectuados en 1950 comprobaron que, entre todos los
varones con 30 aos de edad, 20 por 100 haban cursado la escuela superior,
50 por 100 tenan certificado de escuela secundaria pero no de escuela
superior, y 30 por 100 no haban llegado a la escuela secundaria. La
distribucin de la poblacin actual es semejante? Se efecta un estudio de 1
000 varones tomados aleatoriamente de quienes hoy tienen 30 aos de edad, y
se descubre que 250 se han graduado en colegio superior, 520 en escuela
secundaria y 230 no han terminado la secundaria. Hgase una prueba a nivel
de significacin de .01.
H: No hay cambio en la distribucin entre 1950 y la actualidad. (Advirtase que
Ho es un supuesto no acerca de la media ola proporcin de una poblacin, sino
acerca de la distribucin global de una poblacin.)
H1: La poblacin actual (esto es: todos los varones que en la actualidad tienen
30 aos de edad) posee distribucin distinta que la poblacin en 1950.
Sea Ola letra 0, no el nmero 0 abreviatura de frecuencia Observada (en
~a actualidad) y E denote frecuencia Esperada. Si no hay cambio en la
distribucin entre 1950, y la actualidad, los datos proporcionados pueden
44 UTA Ing. M.B.A William Teneda
presentarse de la manera siguiente:
Graduados de colegio superior
Graduados de escuela secundaria
No graduados de escuela secundaria
Total de graduados
En 1950, 20 por 100 tenan estudios superiores. En consecuencia, caba
esperar que en una muestra de 1 000,20 por 100 200 varones fuesen
graduados de colegio superior, 50 por 100 500 varones hubiesen terminado la
escuela secundaria, y 30 por 100 300 no hubiesen terminado la secundaria.
Advirtase que comenzamos escalando la columna E de modo que la suma
sea igual a la de la columna 0. Es inadecuado expresar la columna O en
nmeros de varones (total 1 000) y la columna E en porcentajes o proporciones
(total 1006 1, respectivamente). Las dos columnas deben sumar el nmero total
de cifras en la muestra.
Ahora debe hacerse una decisin de eleccin: qu debe utilizarse como
requisito para aceptar o rechazar H(OE) describe la diferencia entre las dos
distribuciones? Pero (0 E) = 0E = n n=0. 0, como se muestra en la
columna OE que sigue, 50+20-70 = 0.
Graduados de escuela
superior
Graduados de secundaria
No graduados de secundaria
Total de graduados
Recuerda que al explicar medidas de variabilidad consideramos (xx)n pero result que(X) siempre es igual a 0? Despus ensayamos (x-)2 y por
ltimo (x)2n la varianza.
En consecuencia, en este caso podemos advertir si (0-E)2 manifiesta la
diferencia entre las dos distribuciones. (0-E)2 = O nicamente si hay ajuste
O E
250 200
520 500
230 300
1000 100
O E O-E (O E)2 (O E)2/E
250 200 50 2500 12.5
520 500 20 400 8
230 200 -70 4900 16.3
1000 1000 0 7800 29.6
45 UTA Ing. M.B.A William Teneda
perfecto entre las frecuencias observada y esperada, y puede ser muy grande
si no concuerdan.
En lugar de limitarnos a usar (0-E)2 empleamos (0-E)2/E. El motivo de lo
anterior es que una partida grande en la columna (0-E) 2es ms perturbadora si
proviene de una categora con frecuencia esperada o calculada pequea que si
la frecuencia esperada es grande, de manera que en el primer caso presenta
mayor ponderacin. Una anotacin de 2500 en la columna (0-E)2 se convierte
en 12.5 si la frecuencia esperada E es 200, pero ser slo 5.0 si la frecuencia
esperada es 500, y 2.5 si la frecuencia esperada o calculada en la categora es
1 000.
Ahora definiremos x2:
x2 = (0E)2E
3.3 Trmino y Conceptos claves
Definicin: El conjunto de todos los resultados posibles de un experimento estadstico se llama espacio muestral y se representa con el smbolo S.
HIPOTESIS ESTADSTICAS
Al intentar alcanzar una decisin, es til hacer hiptesis (o conjeturas) sobre la
poblacin implicada. Tales hiptesis, que pueden ser o no ciertas, se llaman
hiptesis estadsticas. Son, en general, enunciados acerca de las
distribuciones de probabilidad de las poblaciones.
Hiptesis nula
En muchos casos formulamos una hiptesis estadstica con el nico
propsito de rechazarla o invalidarla. As, si queremos decidir si una moneda
est trucada, formulamos la hiptesis de que la moneda es buena (o sea, p =
0.5, donde p es la probabilidad de cara). Anlogamente, si deseamos
decidir si un procedimiento es mejor que otro, formulamos la hiptesis de que
no hay diferencia entre ellos (o sea, que cualquier diferencia observada se debe
46 UTA Ing. M.B.A William Teneda
simplemente a fluctuaciones en el muestreo de la misma poblacin). Tales
hiptesis se suelen llamar hiptesis nula y se denotan Ho
Hiptesis alternativa
Toda hiptesis que difiera de una dada se llamar una hiptesis alternativa.
Por ejemplo, si una hiptesis es p = 0.5, hiptesis alternativas podran ser p =
0.7, p 0.5 o p > 0.5. Una hiptesis alternativa a la hiptesis nula se
denotar por H1.
ERRORES DE TIPO I Y DE TIPO II
Si rechazamos una hiptesis cuando debiera ser aceptada, diremos que se ha
cometido un error Tipo I.
Por otra parte, si aceptamos una hiptesis que debiera ser rechazada, diremos
que se ha cometido un error de Tipo II. En ambos casos, se ha producido un
juicio errneo.
Para que las reglas de decisin (o contrastes de hiptesis) sean buenas, deben
disearse de modo que minimicen los errores de la decisin. Y no es una
cuestin sencilla, porque para cualquier tamao de la muestra, un intento de
disminuir un tipo de error suele ir acompaado de un crecimiento del otro tipo.
En la prctica, un tipo de error puede ser ms grave que el otro, y dbil alcanzarse
un compromiso que disminuya el error ms grave. La nica forma de disminuir
ambos al la vez es aumentar el tamao de la muestra, que no siempre es
posible.
Tipos de errores
Definicin.- El rechazo de la hiptesis nula cuando es verdadero se llama error de tipo 1
Definicin.-No rechazarla hiptesis nula cuando es falsa se llama error de tipo 2
47 UTA Ing. M.B.A William Teneda
Cmo sabremos si est cometiendo un error de tipo I o de tipo II?
Examinar la lgica de la influencia estadstica.
Cmo saber si hemos rechazado o no una hiptesis nula equivocadamente?
Coleccionar muestras y extraemos inferencias de las mismas nica y
exclusivamente.
No hay manera entonces de saber qu experimentos proporcionan resultados adecuados y cules no?
La respuesta es si. Si tuviramos que repetir el experimento y obtener
resultados parecidos tendramos mayor confianza de no estar cometiendo un
error de tipo I
3.4 Preguntas y Problemas Claves
1. Defina cada uno de los conceptos de la seccin "trminos importantes".
2. Supongamos que se cumplen los supuestos fundamentales de la prueba t.
Cules son las caractersticas de la distribucin muestral de t?
3. Explique lo que significa grados de libertad. Proponga un ejemplo.
4. Cules son los supuestos fundamentales para el uso apropiado de la prueba
t?
5. Analice las semejanzas y las diferencias entre las pruebas z y t.
6. Explique brevemente por qu la prueba z es ms poderosa que la prueba t.
48 UTA Ing. M.B.A William Teneda
7. Cul de las siguientes afirmaciones es ms correcta desde el punto de vista
tcnico? 1) Tenemos el 95% de confianza de que la media de la poblacin se encuentra en el intervalo 80-90, o bien,
8. 2) tenemos el 95% de confianza de que el intervalo 80-90 contiene la media de la poblacin. Explique.
9. Explique por qu gl = N - 1 cuando se utiliza la prueba t con una sola muestra.
10. Si el coeficiente de correlacin de una muestra tiene un valor diferente de cero
(por ejemplo, r = 0.45), esto significa automticamente que la correlacin en la
poblacin tambin es diferente de cero. Es correcta esta afirmacin?
Explique.
11. Con el mismo conjunto de datos mustrales, el intervalo de confianza de 99%
para la media poblacional es mayor o menor que el intervalo de confianza de
95% ? Le parece a usted lgico? Explique.
12. Un conjunto muestral de 30 datos tiene una media de 82 y una desviacin
estndar de 12. Podemos rechazar la hiptesis de que se trata de una
muestra aleatoria, extrada de una poblacin normal con = 85? Utilice =
0.012colas Para tomar su decisin, otra
13. Es razonable considerar una muestra con N = 22, __X obt = 42 y s = 9 como una
muestra aleatoria extrada de una poblacin normal con =38? Utilice =
0.05 1 cola para tomar su decisin. Suponga que __X obt est en la direccin
correcta, otra
14. En cada una de las siguientes muestras aleatorias, determine los intervalos de
confianza de 95 y el 99% para la media poblacional:
i. __X obt = 25, s = 6, N = 15
ii. __X obt = 120, s = 8, N = 30
49 UTA Ing. M.B.A William Teneda
iii. __X obt = 30.6, s = 5.5, N = 24
iv. Vuelva a resolver la parte a con N = 30. Qu ocurre con el
intervalo de confianza cuando N crece? Otra
15. Supongamos que se desconoce la desviacin estndar poblacional del
problema 21 del captulo 12, pgina 291. Utilice de nuevo = 0.052 Colas, Qu
podra concluir con respecto a la tcnica de la estudiante? Explique la
diferencia entre la conclusin del problema 21 y la de este problema, clnica,
salud.
16. si una variable aleatoria tiene distribucin normal estndar, calcula la
probabilidad de que tome un valor:
(a) menor que 1.50; (b) mayor que 2.16;
(c) mayor que -1.175;
17. escriba el valor de z si la probabilidad de que una variable aleatoria de
distribucin normal estndar tome un valor:
(a) menor que z es 0.9911; (b) mayor que z es 0.1093;
(c) mayor que z es 0.6443; (d) menor que z es 0.0217
e) entre z y z es 0.9298
18. una variable aleatoria tiene una distribucin normal con = 62.4hallar su
desviacin estndar si la probabilidad de que tome un valor mayor que 79.2 es
verifica que
z0.005=2.575
z0.025=1.96
3.5 Bibliografa Complementaria
Robert Pagano. Estadstica Para Las Ciencias Del Comportamiento 7 Edicin.
Editorial Thomson. Impreso En Litograf Nueva poca. Enero 2006, Mxico Df
50 UTA Ing. M.B.A William Teneda
Estadstica De Gilbert. Editorial Interamericana Impreso En Mxico 1980.
Primera Edicin
Estadstica De Schaum. Segunda Edicin. Editorial Mcgraw Hill.
Ronald E. Walpole, Raymond H. Myers. Probabilidad Y
Estadstica. Editorial: 2007 Pearson Education De Mexico
Jack R. Benjamin. Probabilidad Y Estadistica. Editorial: 1981
McgrawHill Latinoamericana Editores S.A De C.V.
Probabilidad Y Estadistica. William Navidi. Editorial: Mcgraw
Hill/Interamericana Editores S.A De C.V. Edicon 2006.
Probabilidad Y Estadistica. Autor: J. Susan Milton Y Jesse C. Arnold. Editorial:
Mcgraw Hill/Interamericana Editores S.A De C.V. Octava Edicin.
Ronald E.; Raymond H. Probabilidad Y Estadstica Para Ingeniera Y Ciencias.
Editorial: Pearson Educacin Printed In Mxico. Ao: Octava Edicin 2007.
Ciro Matnez Bencardino. Estadstica Bsica, Probabilidad Y Estadstica.
Editorial: Ecoe Ediciones. Quinta Edicin ,Agosto De 1990.
Estadistica de Inferencia. Hctor Anbal Saltos.