Manual de Estadística

1 UTA Ing. M.B.A William Teneda

UNIVERSIDAD TCNICA DE AMBATO

GUIA DEL MODULO

ESTADISTICA

Ing. M.B.A William Fabin Teneda Llerena


CAPITULO I

ESTADIGRAFOS DE POSICION Y

ESTADIGRAFOS DE DISPERSION

I.1 Objetivos

Diferenciar entre los estadgrafos de posicin y los estadgrafos de dispersin.

Demostrar el inters en la aplicacin de los estadgrafos.

Comprender como se desarrollan y se aplica las medidas de tendencia central

[estadgrafos de posicin] y los estadgrafos de dispersin.

I.2 Marco Terico

I.2.1 DISTRIBUCIN DE FRECUENCIAS

La distribucin de frecuencias es un mtodo para organizar y resumir datos. Con este

mtodo los datos que componen una serie se clasifican y ordenan indicndose el

nmero de veces que se repite el valor.

ELABORACIN DE UNA TABLA DE FRECUENCIAS

Variable Discreta.- es necesario familiarizarse con algunos smbolos.

n = tamao muestra

N = tamao poblacin

X i = identificacin de cada valor observado

n i = frecuencia absoluta

h i = frecuencia relativa

N i = frecuencia absoluta acumulada

H i = frecuencia relativa acumulada


Y i = indican los valores que toman las variables

y i = marca de clase

m = nmero de valores que toma la variable Yi. Tambin se

considera el nmero de intervalos o marcas de clase en la variable.

Ejercicio.

Supongamos una poblacin constituida por 200 cajas y se desea examinarlas,

determinndose el nmero de piezas defectuosas que contiene cada caja. Por

diferentes razones se desea que la investigacin no sea exhaustiva, es decir

seleccionar una muestra de tamao 20, correspondiendo a una investigacin

parcial.

N = 200 n = 20

El resultado de esta encuesta, se anota a continuacin, siendo X1 la primera

caja examinada y 3 el nmero de piezas defectuosas encontradas en esa caja.

x1= 3 x6= 3 x11= 3 x16= 2

x2= 2 x7= 1 x12= 3 x17= 4

X3= 0 X8= 1 X13= 4 X18= 2

x4= 2 x9= 0 x14= 4 x19= 4

x5= 3 x10= 1 x15= 3 x20= 2

Variable contnua.- debemos conocer

m = nmero de intervalos

c = amplitud del ancho del intervalo

Yi ni hi Ni Hi0 2 0,10 2 0,101 3 0,15 5 0,252 5 0,25 10 0,503 6 0,30 16 0,804 4 0,20 20 1,00

20 1 ---- ----


=

Histograma, usado para variables continuas. En el eje OX se sealan los extremos de

los intervalos. Se construyen unos rectngulos de base la amplitud del intervalo y de

altura la frecuencia absoluta.

Polgono de frecuencias, se obtiene uniendo los puntos medios de los segmentos

superiores de los rectngulos del diagrama.

Grfico de sectores, es el resultado de dividir un crculo en sectores circulares de

ngulos proporcionales a las frecuencias absolutas de cada valor de la variable. Para

calcular los grados de cada sector se divide la frecuencia entre el nmero de datos y

se multiplica por 360.Se utiliza para variable discreta y continua.

1.2.2. MEDIDAS DE TENDENCIA CENTRAL [ESTADGRAFOS DE POSICIN]

Estas medidas tienden a ubicarse en el centro del conjunto.

Proporcionan un valor simple y representativo, que resume un gran volumen de

informacin.

1. Media Aritmtica

2. Mediana

3. Moda

4. Media Geomtrica

5. Media Armnica

6. Media Cuadrtica

7. Media Cbica

8. Cuartiles, Deciles y Percentiles

1. Media Artimtica


La media aritmtica se puede calcular para datos agrupados y no agrupados.

La media aritmtica de un conjunto de valores x1 , x2, x3,............xn se obtiene

sumando todos los valores y dividiendo por el nmero de datos n.

XI= 1,26 X=

X2=1,75 n

Exi

X3= 1,64 x=

X4= 1,45 n

x1+x2+x3+x4+x5

X5= 1,38 x= 1,25+1,75+1,64+1,45+1,38 = 7,47

5 5

= 1,44

Y1 y2 ni yi yini Ni

2 4 1 3 3 1

4 6 3 5 15 4

6 8 7 7 49 11

8 10 2 9 18 13

10 12 4 11 44 17

Eni= 17 Exiyi= 129

X=

nT

Exini

X= 129

17

= 1,58

2. Mediana


De un conjunto ordenado de datos es aquel valor tal que la mitad de los datos

son iguales o inferiores a l y la otra mitad son iguales o superiores.

Si el nmero de datos es pequeo los ordenamos y cogemos el valor central.

Caso 1: Cuando el nmero de datos es impar:

Si los valores son 4,6,4,5,7,3,9. Los ordenamos 3,4,4,5,6,7,9, cmo son 7

datos

cogemos el dato que ocupa el lugar 4 que es 5.

Caso 2: Cuando el nmero de datos es impar:

Si los valores son 4,6,5,7,3,9. Los ordenamos 3,4,5,6,7,9, cmo son 6 datos

cogemos los datos que ocupan el lugar 3 que es 5 y el lugar 4 que es 6. la

mediana es la media de los dos nmeros es este caso 5,5 =(5+6)/2

ejercicios de mediana

Y1 y2 ni yi yini Ni

2 4 1 3 3 1

4 6 3 5 15 4

6 8 7 7 49 11

8 10 2 9 18 13

10 12 4 11 44 17

me = yj-1+c (

Nj

(n/2) Nj -1

me = 6+2 ( 3.5 +4

11

)

me = 6 + 2 +

11

4.5

me = 6.81

3. Moda

La moda de un conjunto de datos es el dato que tiene mayor frecuencia.

El intervalo modal es el de mayor frecuencia absoluta. Cuando tratamos con

datos agrupados antes de definir la moda, se ha de definir el intervalo modal.


La moda, cuando los datos estn agrupados, es un punto que divide al

intervalo modal en dos partes de la forma p y c-p, siendo c la amplitud del

intervalo, que verifiquen

que:

Siendo la frecuencia absoluta del intervalo modal las frecuencias absolutas de

los intervalos anterior y posterior, respectivamente, al intervalo modal.

ejercicios de moda

Y1 y2 ni Yi yini Ni

2 4 1 3 3 1

4 6 3 5 15 4

6 8 7 7 49 11

8 10 2 9 18 13

10 12 4 11 44 17

md = yj-1+c (

nj+1+nj-1

(nj+1) )

md = 6+2 ( 2 )

2+8

md = 6 +

5

4

md = 6.8

4. Media Geomtrica

Es considerada como una medida de posicin simbolizada por Mo y su

resultado al ser calculado debe estar comprendido entre la media armnica y la

aritmtica.


Sea una distribucin de frecuencias (x , n ). La media geomtrica, que

denotaremos por G. se define como la raz N-sima del producto de los N

valores de la distribucin.

Si los datos estn agrupados en intervalos, la expresin de la media

geomtrica, es la misma, pero utilizando la marca de clase (Xi).

El empleo ms frecuente de la media geomtrica es el de promediar variables

tales como porcentajes, tasas, nmeros ndices. etc., es decir, en los casos en

los que se supone que la variable presenta variaciones acumulativas.

Ventajas e inconvenientes:

- En su clculo intervienen todos los valores de la distribucin.

- Los valores extremos tienen menor influencia que en la media aritmtica.

- Es nica.

- Su clculo es ms complicado que el de la media aritmtica.

Adems, cuando la variable toma al menos un x = 0 entonces G se anula, y si

la variable toma valores negativos se pueden presentar una gama de casos

particulares en los que tampoco queda determinada debido al problema de las

races de ndice par de nmeros negativos.

5. Media Armnica

Se utiliza como una medida de tendencia central para conjunto que consisten

en caja de cambios.

La media armnica, que representaremos por H, se define como sigue:


Es la inversa de la media aritmtica de las inversas de los valores de la variable,

responde a la siguiente expresin:

....3

3

21

2

1

1 +++==

xn

xn

xn

n

xn

nH

i

i

Obsrvese que la inversa de la media armnica es la media aritmtica de los

inversos de los valores de la variable. No es aconsejable en distribuciones de

variables con valores pequeos. Se suele utilizar para promediar variables tales

como productividades, velocidades, tiempos, rendimientos, cambios, etc.

Ventajas e inconvenientes:

- En su clculo intervienen todos los valores de la distribucin.

- Su clculo no tiene sentido cuando algn valor de la variable toma valor

cero.

- Es nica.

Relacin entre las medias:

ejercicio de media armnica X1=0,15 M-1 = n = Q 3

X2=0,18 E(/xi) (1/0,15)+(1/0,18)+(1/0,17)

G

X3=0,17 M-1= 0,165

M-1 = n = Q 10

E(/Yi) 0,0614

G

M-1= 162,866


6. Media Cuadrtica

La media cuadrtica es igual a la raz cuadrada de la suma de los cuadrados

de los valores dividida entre el nmero de datos:

Esta media como medida de asociacin tiene aplicaciones tanto en ciencias

biolgicas como en medicina.

A veces la variable toma valores positivos y negativos, como ocurre, por

ejemplo, en los errores de medida. En tal caso se puede estar interesado en

obtener un promedio que no recoja los efectos del signo. Este problema se

resuelve, mediante la denominada media cuadrtica. Consiste en elevar al

cuadrado todas las observaciones (as los signos negativos desaparecen), en

obtener despus su media aritmtica y en extraer, finalmente, la raz cuadrada

de dicha media para volver a la unidad de medida original.

ejercicio de media cuadrtica

m2 = Eyi2*ni = 1020

n 20

= 7,4

7. Media Cbica

La media cbica es una medida derivada de la media aritmtica y consiste en

obtener el valor del lado que tiene el cubo media de un conjunto de n cubos.

yi ni Yi*ni Yi2*ni

2

4

6

8

10

2

3

5

6

4

4

12

30

48

40

8

48

180

384

400

1020


ejercicio de media cubica X1= 5 X2=6 m3 =

X3=10 5

53+63+103+123+73

X4=12 m3= 8,80

X5=7

8. Cuartiles, Deciles y Percentiles

Los cuartiles son los tres valores de la variable que dividen a un conjunto de

datos Ordenados en cuatro partes iguales.

Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75%

de los datos. Q2 coincide con la mediana.

Los deciles son los nueve valores que dividen la serie de datos en diez partes

iguales. Los deciles dan los valores correspondientes al 10%, al 20%... y al

90% de los datos. D5 coincide con la mediana.

Los percentiles son los 99 valores que dividen la serie de datos en 100 partes

iguales. Los percentiles dan los valores correspondientes al 1%, al 2%... y al

99% de los datos. P50 coincide con la mediana.

I.2.3 ESTADIGRAFOS DE DISPERSION

Se llaman medidas de dispersin aquellas que permiten retratar la distancia de los

valores de la variable a un cierto valor central, o que permiten identificar la

concentracin de los datos en un cierto sector del recorrido de la variable. Se trata

de coeficiente para variables cuantitativas.

1. Varianza

2. Desviacin Tpica

3. Desviacin Media


1. Varianza

Varianza: Es la media de los cuadrados de las desviaciones de los datos

respecto a la media.

2. Desviacin Tpica

Desviacin Tpica: Es la raz cuadrada de la varianza. Se calcula aplicando

esta frmula.

3. Desviacin Media

Desviacin media de un conjunto de datos es la media aritmtica de los valores

absolutos de las desviaciones respecto a la media.


I.3 Trminos y Conceptos claves

Variable.- una variable es una cantidad sujeta a variacin existen 2 tipos de variables; las cuantitativas y cualitativas.

Dentro de las variables cuantitativas podemos distinguir las variables discretas y las

variables continuas.

a) Variables Discretas .- valores enteros

b) Variables Continuas.- valores fraccionables

Tablas Y Graficas.- la presencia de datos en una investigacin se las puede representar de varias formas que pueden ser: textuales, cuadros o tablas y grficas.

I.4 Preguntas y Problemas i. Las notas de una estudiante han sido 85, 76, 93, 82 y 96. Calcular los

estadgrafos de posicin y de dispersin. ii. Un conjunto de nmeros contiene 6 seises, 7 sietes, 8 ochos, 9 nueves y 10

dieces. Calcular los estadgrafos de posicin y de dispersin. iii. Tres profesores de economa dieron notas medias en sus cursos, con 32, 25 y

17 estudiantes de 79, 74 y 82 puntos, respectivamente. Hallar la puntuacin

media de los tres cursos.

I.5 Bibliografa Complementaria

Robert Pagano. Estadstica Para Las Ciencias Del Comportamiento 7 Edicin.

Editorial Thomson. Impreso En Litograf Nueva poca. Enero 2006, Mxico Df

Estadstica De Gilbert. Editorial Interamericana Impreso En Mxico 1980.

Primera Edicin

Estadstica De Schaum. Segunda Edicin. Editorial Mcgraw Hill.

Ronald E. Walpole, Raymond H. Myers. Probabilidad Y

Estadstica. Editorial: 2007 Pearson Education De Mexico

Jack R. Benjamin. Probabilidad Y Estadistica. Editorial: 1981

McgrawHill Latinoamericana Editores S.A De C.V.

Probabilidad Y Estadistica. William Navidi. Editorial: Mcgraw

Hill/Interamericana Editores S.A De C.V. Edicon 2006.


Probabilidad Y Estadistica. Autor: J. Susan Milton Y Jesse C. Arnold. Editorial:

Mcgraw Hill/Interamericana Editores S.A De C.V. Octava Edicin.

Ronald E.; Raymond H. Probabilidad Y Estadstica Para Ingeniera Y Ciencias.

Editorial: Pearson Educacin Printed In Mxico. Ao: Octava Edicin 2007.

Ciro Matnez Bencardino. Estadstica Bsica, Probabilidad Y Estadstica.

Editorial: Ecoe Ediciones. Quinta Edicin ,Agosto De 1990


CAPITULO II

REGRESION Y CORRELACION

2.1Objetivos

Emplear adecuadamente los diferentes tipos de regresiones.

Dominar la utilizacin de las regresiones.

2.2Marco Terico

REGRESIONES

La regresin es una tcnica estadstica utilizada para simular la relacin existente

entre dos o ms variables. Por lo tanto se puede emplear para construir un modelo

que permita predecir el comportamiento de una variable dada.

La regresin es muy utilizada para interpretar situaciones reales, pero comnmente se

hace de mala forma, por lo cual es necesario realizar una seleccin adecuada de las

variables que van a construir las ecuaciones de la regresin, ya que tomar variables

que no tengan relacin en la prctica, nos arrojar un modelo carente de sentido, es

decir ilgico.

Segn sea la dispersin de los datos (nube de puntos) en el plano cartesiano, pueden

darse alguna de las siguientes relaciones, Lineal, Logartmica, Exponencial,

Cuadrtica, entre otras.

Regresin Lineal El objetivo de la tcnica de regresin es establecer la relacin estadstica que existe

entre la variable dependiente (Y) y una o ms variables independientes (X1, X2, Xn).

Para poder realizar esto, se postula una relacin funcional entre las variables. Que en

la prctica es la relacin lineal:

= b0 + b1x1 + bnxn

donde los coeficientes b0 y b1, bn, son los parmetros que definen la variacin

promedio de y, para cada valor de x..


El anlisis de regresin se utiliza para fines de prediccin. Y el anlisis de correlacin

se utiliza para medir la fuerza de la asociacin entre las variables cuantitativas.

- El parmetro b0, conocido como la ordenada en el origen, nos indica cunto es Y

cuando X = 0. El parmetro b1, conocido como la pendiente, nos indica cunto

aumenta Y por cada aumento en X.

- La tcnica consiste en obtener estimaciones de estos coeficientes a partir de una

muestra de observaciones sobre las variables Y y X.

REGRESIN POLINOMIAL

En situaciones donde la relacin funcional entre la respuesta Y y la variable independiente x no se puede aproximar de manera adecuada mediante una relacin lineal, es, algunas veces, posible obtener un ajuste razonable considerando una relacin polinomial. Es decir, podemos ajustar el conjunto de datos a una relacin funcional de la forma:

Y = Bo + Box + B2x2 + Brxr + e

Donde B0, B1,, Br son coeficientes de regresin que tienen que estimarse. Si los datos constan de los n pares (.xi, Yi), i= 1,..,n, entonces los estimadores de mnimos cuadrados de, B0,.....,Br llammoslos BO,..., Br son aquellos valores que minimizan

Para determinar estos valores, obtenemos las derivadas parciales de la suma de cuadrados anterior, respecto a BO,... Br, y luego, igualamos a cero con el objetivo de determinar los valores minimizantes. Al hacer esto y reordenando despus las ecuaciones resultantes, obtenemos que los estimadores de mnimos cuadrados, BO,BI,Br satisfacen el conjunto de r + 1 ecuaciones lineales, llamadas ecuaciones normales.


Al ajustar una funcin polinomial a un conjunto de pares de datos, con

frecuencia es posible determinar el grado necesario del polinomio mediante un estudio del diagrama de dispersin. Que queremos enfatizar que siempre se debe usar el menor grado posible que parezca describir los datos adecuadamente. (As, por ejemplo, aunque normalmente es posible encontrar un polinomio de grado n que pase por todos los n pares (xi, Yi), i=1,,n, sera difcil tener mucha confianza en tal ajuste.)

- Resulta muy arriesgado, an ms que en el caso de la regresin lineal, usar un polinomio ajustado para predecir el valor de una respuesta a un nivel de entrada x0 que este lejos de los niveles de entrada xi, i=1,,n usados para encontrar el polinomio de ajuste. (El polinomio de ajuste puede ser vlido slo en una regin alrededor de las xi, i=1,,n y no incluir a x0).

Regresin Lineal Mltiple

Muchas aplicaciones del anlisis de regresin involucran situaciones donde se

tiene ms de una variable de regresin. Un modelo de regresin que contiene ms

de un regresor recibe el nombre de modelo de regresin mltiple

Como ejemplo, supngase que la vida eficaz de una herramienta de corte depende

de la velocidad de corte y del ngulo de la herramienta. Un modelo de regresin

mltiple que puede describir esta relacin es el siguiente

= + 11 + 22 +


FORMULAS PARA EL CALCULO DE REGRESIONES

1. REGRESION LINEAL: = 0 + 1 y = 0 + 1 1 = ()()2 () 2 0 = 1 2 = 0 + 1 1 () 2

( 2) 1 () 2 = 0 + 1 = 0 + 1 2 x

2. REGRESION LOGARITMICA: = 0 + 1

1 = ( )( )( ) 2( ) 2 y 0 = 1 2 = 0 +1 ( )1( ) 2

(2)1

() 2 = 0 + 1 = 0 + 1 () = 0 + 1 2

x


3. REGRESION EXPONENCIAL: = 0 + 1 y

1 = ( )()( ) 2() 2 = 0 = 1 = 0 + 1 2 = 0 + 1 () 1 ( ) 2

( 2) 1 ( ) 2 = 0 + 1 () = 0 + 1 2 x

4. REGRESION POTENCIAL: = 0 + 1 y

1 = ( )( )( ) 2( ) 2 = 0 = 1 = 0 + 1 2 = 0 + 1 () 1 ( ) 2

( 2) 1 ( ) 2 = 0 + 1 ()() = 0 + 1 2

5. REGRESION CUADRATICA: = 0 + 1 + 22

1) = 0 + 1 + 2 2 2) = 0 + 1 2 + 2 3 3) 2 = 0 2 + 1 3 + 2 4

2 = 0 + 1 + 2 2 1 () 2(2) 1 () 2


6. REGRESION CUBICA: = 0 + 1 + 22 + 33 1) = 0 + 1 + 2 2 + 3 3 2) = 0 + 1 2 + 2 3 + 3 4 3) 2 = 0 2 + 1 3 + 2 4 + 3 5 4) 3 = 0 3 + 1 4 + 2 5 + 3 6

2 = 0 + 1 + 2 2 + 3 3 1 () 2(2) 1 () 2

7. REGRESION MULTIPLE: 1) = 0 + 1 1 + 2 2 2) 1 = 0 1 + 1 12 + 2 12 3) 2 = 0 2 + 1 12 + 2 2 2

2 = 0 + 1 + 2 2 1 () 2(2) 1 () 2

2.3Trminos y Conceptos claves

Interpretacin de los Coeficientes de Regresin:

Interpretacin del intercepto :

Indica el valor promedio de la variable de respuesta Y cuando X es cero. Si se tiene

certeza de que la variable predictoria X no puede asumir el valor 0, entonces la

interpretacin no tiene sentido.

Interpretacin de la pendiente :

Indica el cambio promedio en la variable de respuesta Y cuando X se incrementa

en una unidad.

Anlisis de Residuales

Un residual es la diferencia entre el valor observado y el valor estimado por

la lnea de regresin ,

El residual puede ser considerado como el error aleatorio observado.


2.4 Problemas

Se desea desarrollar un modelo de regresin polinmica para predecir la temperatura ambiente para la calefaccin domstica durante el mes de enero en funcin del consumo de combustible ambiente.

Observacin Temperatura

Ambiente Consumo Mensual De

Petrleo Cantidad De Aislamiento

(Diaria Promedio) Para Calefaccin [Galones] En El tico

[F] [Pulgadas]

1 40 27,5 3

2 27 36,4 3

3 40 16,4 10

4 73 4,1 6

5 64 9,4 6

6 34 23,1 6

7 9 36,7 6

Regresin Cbica

X1 Y Y2 X1Y X21Y X31Y

27,5 40 1600 1100 30250 831875

36,4 27 729 982,8 35773,92 1302171

16,4 40 1600 656 10758,4 176437,8

4,1 73 5329 299,3 1227,13 5031,233

9,4 64 4096 601,6 5655,04 53157,38

23,1 34 1156 785,4 18142,74 419097,3

36,7 9 81 330,3 12122,01 444877,8

153,6 287 14591 4755,4 113929,24 3232647


X21 X31 X41 X51 X61

756,25 20796,875 571914,063 15727636,72 432510009,8

1324,96 48228,544 1755519 63900891,66 2325992456

268,96 4410,944 72339,4816 1186367,498 19456426,97

16,81 68,921 282,5761 1158,56201 4750,104241

88,36 830,584 7807,4896 73390,40224 689869,7811

533,61 12326,391 284739,632 6577485,502 151939915,1

1346,89 49430,863 1814112,67 66577935,07 2443410217

4335,84 136093,122 4506714,92 154044865,4 5374003645

Frmulas

321

bbbbo

=

YXYX

XYY

31

21

Matriz Inversa

61

51

41

31

51

41

31

21

41

31

211

31

211

xxxxxxxxxxxxxxxn

=

3232647,12113929,24

4755,4287

53740036454154044865,64506714,91136093,1224154044865,64506714,91136093,1224335,8464506714,91136093,1224335,84153,6

136093,1224335,84153,67

321

bbbbo

07-2,08942E05-1,30796E-0,000225760,00091455-05-1,30796E-80,000830680,01463819-0,060961830,0002257610,01463819-0,266422941,16835825-

0,00091455-60,060961791,16835825-5,80046665

=

321

bbbbo

3232647,12113929,24

4755,4287


7902272251 -0,003591836379108 0,243669352

7294009 -6,27687081670896 97,6351505

====

bbbbo

Ecuacin Cbica

bo X b1 X b2 X b3 Y 23 +++=

Y = -0,0036X3 + 0,2437X2 - 6,2769X+ 97,635

Coeficiente De Determinacin Y De Correlacin

22

232

2

)(1)(

)(1321

+++=

Yn

Y

Yn

YXbYXbXYbYboR

28246127732555,043672 =R

85438150,904760502 =R

72785720,95118899=R

Grfica:

0

20

40

60

80

0 10 20 30 40

Consumo De Combustible [Galones]

Tem

pera

tura

Pro

med

io

Diar

ia [

F]


Qu temperatura debera tener el ambiente si el consumo de tuviera 35 galones para el modelo utilizado en el literal anterior?

Y = -0,0036X3 + 0,2437X2 - 6,2769X+ 97,635

Y= 22,4378184793661 F

Regresin Cuadrtica

X1 Y Y2 X1Y X21Y X21 X31 X41

27,5 40 1600 1100 30250 756,25 20796,875 571914,063

36,4 27 729 982,8 35773,92 1324,96 48228,544 1755519

16,4 40 1600 656 10758,4 268,96 4410,944 72339,4816

4,1 73 5329 299,3 1227,13 16,81 68,921 282,5761

9,4 64 4096 601,6 5655,04 88,36 830,584 7807,4896

23,1 34 1156 785,4 18142,74 533,61 12326,391 284739,632

36,7 9 81 330,3 12122,01 1346,89 49430,863 1814112,67

153,6 287 14591 4755,4 113929,24 4335,84 136093,122 4506714,92

Formulas

41

31

21

31

211

211

xxxxxxxxn

21

bbbo

=

YXYX

Y

21

1

4506714,92136093,1224335,84136093,1224335,84153,6

4335,84153,67

21

bbbo

=

113929,244755,4

287


Matriz Inversa

Ecuacin Cuadrtica

boXbXbY ++= 12 2

81,913 2,3958X - 0,0188X 2 +=Y


22

22

2

)(1)(

)(121

++=

Yn

Y

Yn

YXbXYbYboR

28246645952493,296282 =R

56395020,882895282 =R

71661540,93962507=R

Grafico:

05-1,192E0,00050563-90,003711740,00050563-0,0224841330,18017899-0,003711750,18017899-71,79742071

113929,244755,4

287

=

21

bbbo

564475910,0188209222991347-2,395816317530581,9132665

===

bbbo

0

20

40

60

80

0 10 20 30 40

Consumo De Combustible [Galones]

Tem

pera

tura

Pro

med

io

Diar

ia [

F]


El conocido urbanista siente que hay una relacin entre una segunda variable independiente la cantidad de aislamiento. Establezca la regresin mltiple y analice los datos

Regresin Mltiple

X1 X2 Y X1X2 X1Y X2Y X21 X22

27,5 3 40 82,5 1100 120 756,25 9

36,4 3 27 109,2 982,8 81 1324,96 9

16,4 10 40 164 656 400 268,96 100

4,1 6 73 24,6 299,3 438 16,81 36

9,4 6 64 56,4 601,6 384 88,36 36

23,1 6 34 138,6 785,4 204 533,61 36

36,7 6 9 220,2 330,3 54 1346,89 36

153,6 40 287 795,5 4755,4 1681 4335,84 262

Frmulas

1. =+ nboYXbXb 21 21

2. n

YXYX

nXX

XXbnX

Xb =

+

11

2121

212

1 2)(

1

3. n

YXYX

nX

Xbn

XXXXb =

+

22

222

2121

21

)(21

1. o7-2872401153,6 bbb =+

2. [ ] [ ] -1542,282,2142857-2965,4171431 =+ bb

3. [ ] [ ] 4133,4285714282,2142857-1 =+ bb


2. 8-1,59744412 0,08515934 -1 =bb

3. 0,498696792 0,40660295 1 =+ bb

-1,098747420,32144361 =b

101,972188-1,888532816-3,41816522

===

bobb

Ecuacin Mltiple

Y = bo b1X1 + b2X2

Y = 101,9721 1,8885X1 -3,41816X2


22

221

2

)(1)(

)(121

++=

Yn

Y

Yn

YXbYXbYboR

28242772,350632 =R

0,981710562 =R

0,99081308=R


2.5 Bibliografa Complementaria




Primera Edicin













Editorial: Ecoe Ediciones. Quinta Edicin ,Agosto De 1990.

Estadistica de Inferencia. Hctor Anbal Saltos.


CAPITULO III

INTRODUCCION A LAS PROBABILIDADES

3.1 Objetivos

Aplicar las probabilidades en ejercicios prcticos

Dominar el empleo de la Distribucin normal, Binomial y Poisson .

Explicar y predecir procesos reales que se presentan en la naturaleza y la

tecnologa con la ayuda de la estadstica para resolver problemas inherentes a

la ingeniera civil y mecnica.

3.2 Marco Terico

PROBABILIDAD

Probabilidad de un suceso es el nmero al que tiende la frecuencia relativa

asociada al suceso a medida que el nmero de veces que se realiza el

experimento crece.

P(X) =

NUMERO DE SUCESO POSIBLES

NUMERO DE EXITOS

TABLA DE CONTINGENCIA El procedimiento Tablas de contingencia crea tablas de clasificacin doble y

mltiple y, adems, proporciona una serie de pruebas y medidas de asociacin

para las tablas de doble clasificacin. La estructura de la tabla y el hecho de

que las categoras estn ordenadas o no determinan las pruebas o medidas

que se utilizaban.

Los estadsticos de tablas de contingencia y las medidas de asociacin slo se

calculan para las tablas de doble clasificacin. Si especifica una fila, una

columna y un factor de capa (variable de control), el procedimiento Tablas de

contingencia crea un panel de medidas y estadsticos asociados para cada

valor del factor de capa (o una combinacin de valores para dos o ms

variables de control). Por ejemplo, si sexo es un factor de capa para una tabla

de casado (s, no) en funcin de vida (vida emocionante, rutinaria o aburrida),

los resultados para una tabla de doble clasificacin para las mujeres se


calculan de forma independiente de los resultados de los hombres y se

imprimen en paneles uno detrs del otro.

ANALISIS COMBINATORIO

Combinacin

Los coeficientes binomiales o combinaciones son una serie de nmeros

estudiados en combinatoria que indican el nmero de formas en que se pueden

extraer subconjuntos a partir de un conjunto dado. Sin embargo, dependiendo

del enfoque que tenga la exposicin, se suelen usar otras definiciones

equivalentes.

Ejercicios De Combinacin

En una clase de 35 alumnos se quiere elegir un comit formado por tres

alumnos. Cuntos comits diferentes se pueden formar?

C 335 = 35*34*33

3*2*1

= 6545

A una reunin asisten 10 personas y se intercambian saludos entre todos.

Cuntos saludos se han intercambiado?

C 210 = 10*9

2

= 45

En

Permutacin matemticas, dado un conjunto finito con todos sus elementos diferentes, llamamos

permutacin a cada una de las posibles ordenaciones de los elementos de dicho

conjunto.

Por ejemplo, en el conjunto {1,2,3}, cada ordenacin posible de sus elementos,

sin repetirlos, es una permutacin. Existe un total de 6 permutaciones para

estos elementos: "1,2,3", "1,3,2", "2,1,3", "2,3,1", "3,1,2" y "3,2,1".

La nocin de permutacin suele aparecer en dos contextos:

Como nocin fundamental de combinatoria, centrndonos en el

problema de su recuento.

En teora de grupos, al definir nociones de simetra.


Ejercicios De Permutaciones

Cuntos nmeros de 5 cifras diferentes se puede formar con los dgitos: 1, 2,

3, 4, 5.?

m = 5 n = 5

P5= 5! = 5*4*2*3*1 = 120

Con las cifras 2, 2, 2, 3, 3, 3, 3, 4, 4; cuntos nmeros de nueve cifras se

pueden formar?

m = 9 a = 3 b = 4 c = 2 a + b + c = 9

S entran todos los elementos. S importa el orden. S se repiten los elementos.

ESPACIO MUESTRAL Y SUCESOS

Experimentos, espacios mustrales y sucesos La teora de las probabilidades trata formalmente de experimentos y de sus resultados donde el trmino experimento se

usa en el sentido ms general. Se denomina espacio muestral la coleccin de todos los

posibles resultados de un experimento. Los elementos del conjunto S de este espacio

se denominan puntos muestrales, cada uno de ellos asociado con uno y slo un

resultado distinto. La precisin para distinguir resultados es cosa de criterio y

depender en la prctica de la utilizacin que se har del modelo.

Ejemplo. Un experimento consiste en lanzar una moneda y despus lanzarla una segunda vez si sale cara. Si sale cruz en el primer lanzamiento, entonces se lanza un dado una vez.

Para listar los elementos del espacio muestral que proporcione la mayor informacin,

construimos el diagrama de rbol de la figura 2.1. Las diversas trayectorias a lo largo de

las ramas del rbol dan los distintos puntos mustrales. Al comenzar con la rama superior

izquierda y movernos a la derecha a lo largo de la primera trayectoria, obtenemos el punto

muestral HH, que indica la posibilidad de que ocurran caras en dos lanzamientos sucesivos

de la moneda. Asimismo, el punto muestral T3 indica la posibilidad.


VALOR ESPERADO O ESPERANZA Si P es la probabilidad de xito de un suceso en un solo ensayo, el numero

esperado o esperanza de ese suceso en N ensayos, estar dado por el producto

de N y la probabilidad de xito P.

E = n.p(x)

Ejemplo.

En el lanzamiento 900 veces de dos dados, Cul es la esperanza de que la suma

de sus caras de un valor menor de 6.?

Probabilidad de xito de un solo ensayo.

(1,1) (1,2) (2,1) (2,2) (2,3) (3,2) (3,1) (1,3) (4,1) (4,4)

p(x): 10/36 n=900

E=np=900*(10/36)=9000/36= 250

La esperanza o valor esperado es de que 250 de los 900 lanzamientos, la

suma de sus caras sea menor de 6

DISTRIBUCION BINOMIAL

Procesos de Bernoulli: Un proceso de Bernoulli es una serie de n experimentos

aleatorios que verifican:

Cada experimento tiene dos resultados posibles, que se llaman xito y fracaso.

La probabilidad p de xito es la misma en cada experimento, y esta

probabilidad no se ve afectada por el conocimiento de los resultados anteriores.

La probabilidad q de fracaso viene dada por q = 1 - p.


Ejemplos :

Una moneda lanzada al aire 15 veces. Los dos resultados posibles son cara y

cruz. La probabilidad de cara en un lanzamiento es 1/2

Se pregunta a 200 alumnos de de un Instituto de Enseanza Secundaria si

estudian Francs. Los dos resultados posibles son s y no. Si se considera

xito la respuesta s, la probabilidad p de xito indica la proporcin de

estudiantes del Instituto que responden s (estudian francs, pues suponemos

que no mienten).

Tirar un dado de seis caras 10 veces y considerar que el resultado de una

tirada, es que salga un nmero par o un nmero impar. Los resultados posibles

en este caso son par e impar.

El espacio muestral, cada uno de los sucesos y la probabilidad de que ocurran,

en un proceso de Bernoulli, aparecen muy ntidamente cuando se construye un

rbol de probabilidades del proceso.

Por ejemplo vamos a construir el rbol de probabilidades de un proceso de

Bernoulli de tres experimentos:

El espacio muestral del proceso est formado por cada uno de los caminos del

rbol de probabilidades. La probabilidad de un camino, por ejemplo, del camino

: EFE es :

Si en un proceso de Bernouilli asignamos el valor 1 al xito y 0 al fracaso y

consideramos el valor Sj , suma de todos los valores de un resultado concreto

(un camino) con j xitos ; la probabilidad que corresponde a cada valor de la

variable Sj es :


Ejercicios De Distribucin Binomial

La probabilidad de xito de una determinada vacuna es 0,72. Calcula la

probabilidad de a que una vez administrada a 15 pacientes:

a) Ninguno sufra la enfermedad

b) Todos sufran la enfermedad

c) Dos de ellos contraigan la enfermedad

Solucin :

Se trata de una distribucin binomial de parmetros B(15, 0'72)

DISTRIBUCIN DE POISSON

En teora de probabilidad y estadstica, la distribucin de Poisson es una

distribucin de probabilidad discreta. Expresa la probabilidad de un nmero k

de eventos ocurriendo en un tiempo fijo si estos eventos ocurren con una tasa

media conocida, y son independientes del tiempo desde el ltimo evento.

La distribucin fue descubierta por Simon-Denis Poisson (17811840) que

public, junto con su teora de probabilidad, en 1838 en su trabajo Recherches


sur la probabilit des jugements en matires criminelles et matire civile

("Investigacin sobre la probabilidad de los juicios en materias criminales y

civiles"). El trabajo estaba enfocado en ciertas variables aleatorias N que

cuentan, entre otras cosas, un nmero de ocurrencias discretas (muchas veces

llamadas "arribos") que tienen lugar durante un intervalo de tiempo de duracin

determinada. Si el nmero esperado de ocurrencias en este intervalo es ,

entonces la probabilidad de que haya exactamente k ocurrencias (siendo k un

entero no negativo, k = 0, 1, 2, ...) es igual a:

dnde

e es el base del logaritmo natural (e = 2.71828...),

k! es el factorial de k,

k es el nmero de ocurrencias de un evento,

es un nmero real positivo, equivalente al nmero esperado de

ocurrencias durante un intervalo dado. Por ejemplo, si los eventos

ocurren de media cada 4 minutos, y se est interesado en el nmero de

eventos ocurriendo en un intervalo de 10 minutos, se usara como

modelo una distribucin de Poisson con = 2.5.

Ejercicios De Distribucin De Poisson

1. Si un banco recibe en promedio 6 cheques sin fondo por da, cules

son las probabilidades de que reciba, a) cuatro cheques sin fondo en un da

dado, b) 10 cheques sin fondos en cualquiera de dos das consecutivos?

Solucin:

a) x = variable que nos define el nmero de cheques sin fondo que llegan al

banco en un da cualquiera = 0, 1, 2, 3, ....., etc, etc.

l = 6 cheques sin fondo por da

e = 2.718


b)

x= variable que nos define el nmero de cheques sin fondo que llegan al banco

en dos das consecutivos = 0, 1, 2, 3, ......, etc., etc.

l = 6 x 2 = 12 cheques sin fondo en promedio que llegan al banco en dos das

consecutivos

Nota: l siempre debe de estar en funcin de x siempre o dicho de otra forma,

debe hablar de lo mismo que x.

2. En la inspeccin de hojalata producida por un proceso electroltico

continuo, se identifican 0.2 imperfecciones en promedio por minuto. Determine

las probabilidades de identificar a) una imperfeccin en 3 minutos, b) al menos

dos imperfecciones en 5 minutos, c) cuando ms una imperfeccin en 15

minutos.

Solucin:

a) x = variable que nos define el nmero de imperfecciones en la hojalata

por cada 3 minutos = 0, 1, 2, 3, ...., etc., etc.

l = 0.2 x 3 =0.6 imperfecciones en promedio por cada 3 minutos en la hojalata

b) x = variable que nos define el nmero de imperfecciones en la hojalata

por cada 5 minutos = 0, 1, 2, 3, ...., etc., etc.

l = 0.2 x 5 =1 imperfeccin en promedio por cada 5 minutos en la hojalata


=1-(0.367918+0.367918) = 0.26416

c) x = variable que nos define el nmero de imperfecciones en la hojalata

por cada 15 minutos = 0, 1, 2, 3, ....., etc., etc.

l = 0.2 x 15 = 3 imperfecciones en promedio por cada 15 minutos en la hojalata

= 0.0498026 + 0.149408 = 0.1992106

.

DISTRIBUCIN NORMAL

La distribucin normal fue reconocida por primera vez por el francs Abraham

de Moivre (1667-1754). Posteriormente, Carl Friedrich Gauss (1777-1855)

elabor desarrollos ms profundos y formul la ecuacin de la curva; de ah

que tambin se la conozca, ms comnmente, como la "campana de Gauss".

La distribucin de una variable normal est completamente determinada por

dos parmetros, su media y su desviacin estndar, denotadas generalmente

por y .

Al igual que ocurra con un histograma, en el que el rea de cada rectngulo es

proporcional al nmero de datos en el rango de valores correspondiente si, tal y

como se muestra en la Figura 2, en el eje horizontal se levantan

perpendiculares en dos puntos a y b, el rea bajo la curva delimitada por esas

lneas indica la probabilidad de que la variable de inters, X, tome un valor

cualquiera en ese intervalo. Puesto que la curva alcanza su mayor altura en


torno a la media, mientras que sus "ramas" se extienden asintticamente hacia

los ejes, cuando una variable siga una distribucin normal, ser mucho ms

probable observar un dato cercano al valor medio que uno que se encuentre

muy alejado de ste.

Propiedades de la distribucin normal:

La distribucin normal posee ciertas propiedades importantes que conviene

destacar:

1. Tiene una nica moda, que coincide con su media y su

mediana.

2. La curva normal es asinttica al eje de abscisas. Por ello,

cualquier valor entre y es tericamente posible. El

rea total bajo la curva es, por tanto, igual a 1.

3. Es simtrica con respecto a su media . Segn esto, para

este tipo de variables existe una probabilidad de un 50% de

observar un dato mayor que la media, y un 50% de observar

un dato menor.

4. La distancia entre la lnea trazada en la media y el punto de

inflexin de la curva es igual a una desviacin tpica ( ).

Cuanto mayor sea , ms aplanada ser la curva de la

densidad.

5. El rea bajo la curva comprendido entre los valores situados

aproximadamente a dos desviaciones estndar de la media

es igual a 0.95. En concreto, existe un 95% de posibilidades

de observar un valor comprendido en el intervalo

.

6. La forma de la campana de Gauss depende de los

parmetros y (Figura 3). La media indica la posicin de

la campana, de modo que para diferentes valores de la

grfica es desplazada a lo largo del eje horizontal. Por otra

parte, la desviacin estndar determina el grado de

apuntamiento de la curva. Cuanto mayor sea el valor de ,

ms se dispersarn los datos en torno a la media y la curva

ser ms plana. Un valor pequeo de este parmetro indica,


por tanto, una gran probabilidad de obtener datos cercanos al

valor medio de la distribucin.

Ejemplo 1:

Utilizando la tabla del rea bajo la curva normal, plantearemos algunos problemas que

servirn de modelo.

a.- para Z = 1.5 y Z = -.1.4

Z = 1.5 la tabla da : 0.4332

Z = 1.4 la tabla da : 0.4192

P(-1.4 < Z < 1.5) = 0.4332+0.4192 = 0.8524

P = 85.24%

b.- si se plantea P( Z < 1.5 corresponden al

siguiente grfico:

0.5000+0.4232 = 0.9332 = 93.32%


c.- otro problema seria P(Z > 1.5) = ?

0.5000-0.4332 = 0.0668 = 6.68%

DISTRIBUCIONES t DE STUDENT

El lector sabe cmo hacer deducciones acerca de la mayora de la poblacin si

cabe suponer que la distribucin muestral de las medias es normal. Sin

embargo, cabe preguntarse qu puede hacerse si se desconoce y n es

pequea, de modo que no puede hacerse esta suposicin de normalidad.

Contestaremos a esta pregunta en el presente captulo. Se encontrar una

familia de distribuciones t(una distinta para cada valor de n), pero no se toma,

porque pronto se descubrir que, conforme n aumenta, la distribucin t

correspondiente se asemeja mucho a la distribucin normal, e incluso cuando n

es pequea, se aplica una distribucin tefe la misma manera en que se hace

con una distribucin normal.

Se aprender cundo utilizar puntuaciones i y cundo utilizar puntuaciones z y

cmo emplear puntuaciones t, para una media de la poblacin y para

diferencias en las medias de dos poblaciones. Por ltimo, se descubrir cmo

tratar puntuaciones apareadas en muestras que no son independientes.

Caractersticas De Las Distribuciones t

Las distribuciones t de Student tienen las siguientes caractersticas:

1. No hay slo una distribucin t sino una distribucin distinta para cada valor den. Hay una curva normal estndar, y un cuadro de una pgina puede dar

reas debajo de esta curva para la mayor parte de los valores de z que nos


interesan. Hay toda una familia de curvas t "estndar". Si se formara un cuadro

para las reas debajo de la curva t para cada n (equivalente al cuadro para las

reas debajo de la curva normal estndar), se necesitara todo un volumen. Los

cuadros t sern muy abreviados.

2. Cada curva t es simtrica a los lados de 0. E-lo significa que la mitad derecha de la curva t tiene este aspecto

Y la mitad izquierda es una imagen en espejo; la curva entera tendr este

aspecto:

A causa de lo anterior, la media de toda distribucin f es 0.

3. El punto ms alto de la curva ocurre cuando t = 0.

4. Al aumentar n, la curva t se acerca cada vez ms a la curva normal. Es fcil advertir lo anterior considerando algunas grficas superpuestas:

Si n es de 30, o ms, la distribucin t y la distribucin normal estndar estn lo

suficientemente cercanas de modo que las reas abajo de esta ltima pueden

utilizarse como aproximacin a las reas debajo de la primera. Esta cercana


de las curvas f y z para valores altos de n es lo que justifica el empleo de la

ecuacin s/Vn como aproximacin de x cuando n es grande y se desconoce

5. Cada distribucin t es una distribucin de probabilidad; esto es: el rea debajo de toda la curva es una, y la probabilidad de que una puntuacin t est

entre a y b es igual a rea debajo de la curva entre las lneas t = a y t = b.

CUANDO SE USA UNA DISTRIBUCIN t?

La distribucin t se usa en las siguientes circunstancias:

a) La poblacin tiene distribucin normal y,

b) Se desconoce o- (pero se conoce s o puede calcularse) y

c) n 30.

Si la poblacin no tiene distribucin normal, se cometer un error. Qu tan

grande es el error? Depende de qu tan lejos est la poblacin de la

distribucin normal. Si es casi normal, el error ser pequeo. Si est muy lejos

de ser normal, la distribucin t es casi intil. En la prctica, el problema es que

a menudo se desconoce si la poblacin sigue o no una curva normal.

GRADOS DE LIBERTAD

Cmo se usa una distribucin t?

Antes de continuar, debemos desviarnos un momento para explicar los grados

de libertad.

Imaginemos tres nios que juegan un juego muy sencillo; a saber: tres cartas

estn marcadas, 0, 10 y 20 respectivamente. Se barajan las cartas y cada nio

por turno toma una. Jaime es impulsivo y toma una carta en primer lugar; tiene

10 puntos. Mara elige en seguida y obtiene 0. Toms toma la ltima carta y

debe tener 20 puntos. Sin embargo, si Jaime sac la carta 0 y Mara la carta

20, Toms sacar la carta 10. El punto es que, una vez que dos nios han

elegido su carta, la tercera est fija. Dos de los nios eligieron libremente: hay

dos grados de libertad.


Sin puntuaciones tienen media X, n -1 puede elegirse libremente y la ltima es

regida; hay n -1 grados de libertad.

Para encontrar un intervalo de confianza o poner a prueba una hiptesis acerca

de la media valindose de la distribucin f para una muestra de dimensin n, el

nmero de grado de libertad es n - 1. La letra D se utiliza para denotar el

nmero de grados de libertad.

D = n - 1

DISTRIBUCION JI CUADRADO En primer lugar, conzcase la letra griega x (ji); no hay equivalente en

castellano, pero fonticamente corresponde a ji. La veremos nicamente en la

forma x2 y nos referiremos a distribuciones de ji cuadrada o pruebas de ji

cuadrada.

Se han conocido varias familias de distribuciones de probabilidad; a saber:

distribuciones binomial, normal y. Ahora se conocer otra familia de

distribuciones de probabilidad; al igual que con las distribuciones t, habr una

distribucin x2 diferente para cada nmero de grados de libertad. Antes de

conocer a fondo una distribucin x2 veamos un problema en el cual se necesita.

Ejemplo 1. Estudios efectuados en 1950 comprobaron que, entre todos los

varones con 30 aos de edad, 20 por 100 haban cursado la escuela superior,

50 por 100 tenan certificado de escuela secundaria pero no de escuela

superior, y 30 por 100 no haban llegado a la escuela secundaria. La

distribucin de la poblacin actual es semejante? Se efecta un estudio de 1

000 varones tomados aleatoriamente de quienes hoy tienen 30 aos de edad, y

se descubre que 250 se han graduado en colegio superior, 520 en escuela

secundaria y 230 no han terminado la secundaria. Hgase una prueba a nivel

de significacin de .01.

H: No hay cambio en la distribucin entre 1950 y la actualidad. (Advirtase que

Ho es un supuesto no acerca de la media ola proporcin de una poblacin, sino

acerca de la distribucin global de una poblacin.)

H1: La poblacin actual (esto es: todos los varones que en la actualidad tienen

30 aos de edad) posee distribucin distinta que la poblacin en 1950.

Sea Ola letra 0, no el nmero 0 abreviatura de frecuencia Observada (en

~a actualidad) y E denote frecuencia Esperada. Si no hay cambio en la

distribucin entre 1950, y la actualidad, los datos proporcionados pueden


presentarse de la manera siguiente:

Graduados de colegio superior

Graduados de escuela secundaria

No graduados de escuela secundaria

Total de graduados

En 1950, 20 por 100 tenan estudios superiores. En consecuencia, caba

esperar que en una muestra de 1 000,20 por 100 200 varones fuesen

graduados de colegio superior, 50 por 100 500 varones hubiesen terminado la

escuela secundaria, y 30 por 100 300 no hubiesen terminado la secundaria.

Advirtase que comenzamos escalando la columna E de modo que la suma

sea igual a la de la columna 0. Es inadecuado expresar la columna O en

nmeros de varones (total 1 000) y la columna E en porcentajes o proporciones

(total 1006 1, respectivamente). Las dos columnas deben sumar el nmero total

de cifras en la muestra.

Ahora debe hacerse una decisin de eleccin: qu debe utilizarse como

requisito para aceptar o rechazar H(OE) describe la diferencia entre las dos

distribuciones? Pero (0 E) = 0E = n n=0. 0, como se muestra en la

columna OE que sigue, 50+20-70 = 0.

Graduados de escuela

superior

Graduados de secundaria

No graduados de secundaria

Total de graduados

Recuerda que al explicar medidas de variabilidad consideramos (xx)n pero result que(X) siempre es igual a 0? Despus ensayamos (x-)2 y por

ltimo (x)2n la varianza.

En consecuencia, en este caso podemos advertir si (0-E)2 manifiesta la

diferencia entre las dos distribuciones. (0-E)2 = O nicamente si hay ajuste

O E

250 200

520 500

230 300

1000 100

O E O-E (O E)2 (O E)2/E

250 200 50 2500 12.5

520 500 20 400 8

230 200 -70 4900 16.3

1000 1000 0 7800 29.6


perfecto entre las frecuencias observada y esperada, y puede ser muy grande

si no concuerdan.

En lugar de limitarnos a usar (0-E)2 empleamos (0-E)2/E. El motivo de lo

anterior es que una partida grande en la columna (0-E) 2es ms perturbadora si

proviene de una categora con frecuencia esperada o calculada pequea que si

la frecuencia esperada es grande, de manera que en el primer caso presenta

mayor ponderacin. Una anotacin de 2500 en la columna (0-E)2 se convierte

en 12.5 si la frecuencia esperada E es 200, pero ser slo 5.0 si la frecuencia

esperada es 500, y 2.5 si la frecuencia esperada o calculada en la categora es

1 000.

Ahora definiremos x2:

x2 = (0E)2E

3.3 Trmino y Conceptos claves

Definicin: El conjunto de todos los resultados posibles de un experimento estadstico se llama espacio muestral y se representa con el smbolo S.

HIPOTESIS ESTADSTICAS

Al intentar alcanzar una decisin, es til hacer hiptesis (o conjeturas) sobre la

poblacin implicada. Tales hiptesis, que pueden ser o no ciertas, se llaman

hiptesis estadsticas. Son, en general, enunciados acerca de las

distribuciones de probabilidad de las poblaciones.

Hiptesis nula

En muchos casos formulamos una hiptesis estadstica con el nico

propsito de rechazarla o invalidarla. As, si queremos decidir si una moneda

est trucada, formulamos la hiptesis de que la moneda es buena (o sea, p =

0.5, donde p es la probabilidad de cara). Anlogamente, si deseamos

decidir si un procedimiento es mejor que otro, formulamos la hiptesis de que

no hay diferencia entre ellos (o sea, que cualquier diferencia observada se debe


simplemente a fluctuaciones en el muestreo de la misma poblacin). Tales

hiptesis se suelen llamar hiptesis nula y se denotan Ho

Hiptesis alternativa

Toda hiptesis que difiera de una dada se llamar una hiptesis alternativa.

Por ejemplo, si una hiptesis es p = 0.5, hiptesis alternativas podran ser p =

0.7, p 0.5 o p > 0.5. Una hiptesis alternativa a la hiptesis nula se

denotar por H1.

ERRORES DE TIPO I Y DE TIPO II

Si rechazamos una hiptesis cuando debiera ser aceptada, diremos que se ha

cometido un error Tipo I.

Por otra parte, si aceptamos una hiptesis que debiera ser rechazada, diremos

que se ha cometido un error de Tipo II. En ambos casos, se ha producido un

juicio errneo.

Para que las reglas de decisin (o contrastes de hiptesis) sean buenas, deben

disearse de modo que minimicen los errores de la decisin. Y no es una

cuestin sencilla, porque para cualquier tamao de la muestra, un intento de

disminuir un tipo de error suele ir acompaado de un crecimiento del otro tipo.

En la prctica, un tipo de error puede ser ms grave que el otro, y dbil alcanzarse

un compromiso que disminuya el error ms grave. La nica forma de disminuir

ambos al la vez es aumentar el tamao de la muestra, que no siempre es

posible.

Tipos de errores

Definicin.- El rechazo de la hiptesis nula cuando es verdadero se llama error de tipo 1

Definicin.-No rechazarla hiptesis nula cuando es falsa se llama error de tipo 2


Cmo sabremos si est cometiendo un error de tipo I o de tipo II?

Examinar la lgica de la influencia estadstica.

Cmo saber si hemos rechazado o no una hiptesis nula equivocadamente?

Coleccionar muestras y extraemos inferencias de las mismas nica y

exclusivamente.

No hay manera entonces de saber qu experimentos proporcionan resultados adecuados y cules no?

La respuesta es si. Si tuviramos que repetir el experimento y obtener

resultados parecidos tendramos mayor confianza de no estar cometiendo un

error de tipo I

3.4 Preguntas y Problemas Claves

1. Defina cada uno de los conceptos de la seccin "trminos importantes".

2. Supongamos que se cumplen los supuestos fundamentales de la prueba t.

Cules son las caractersticas de la distribucin muestral de t?

3. Explique lo que significa grados de libertad. Proponga un ejemplo.

4. Cules son los supuestos fundamentales para el uso apropiado de la prueba

t?

5. Analice las semejanzas y las diferencias entre las pruebas z y t.

6. Explique brevemente por qu la prueba z es ms poderosa que la prueba t.


7. Cul de las siguientes afirmaciones es ms correcta desde el punto de vista

tcnico? 1) Tenemos el 95% de confianza de que la media de la poblacin se encuentra en el intervalo 80-90, o bien,

8. 2) tenemos el 95% de confianza de que el intervalo 80-90 contiene la media de la poblacin. Explique.

9. Explique por qu gl = N - 1 cuando se utiliza la prueba t con una sola muestra.

10. Si el coeficiente de correlacin de una muestra tiene un valor diferente de cero

(por ejemplo, r = 0.45), esto significa automticamente que la correlacin en la

poblacin tambin es diferente de cero. Es correcta esta afirmacin?

Explique.

11. Con el mismo conjunto de datos mustrales, el intervalo de confianza de 99%

para la media poblacional es mayor o menor que el intervalo de confianza de

95% ? Le parece a usted lgico? Explique.

12. Un conjunto muestral de 30 datos tiene una media de 82 y una desviacin

estndar de 12. Podemos rechazar la hiptesis de que se trata de una

muestra aleatoria, extrada de una poblacin normal con = 85? Utilice =

0.012colas Para tomar su decisin, otra

13. Es razonable considerar una muestra con N = 22, __X obt = 42 y s = 9 como una

muestra aleatoria extrada de una poblacin normal con =38? Utilice =

0.05 1 cola para tomar su decisin. Suponga que __X obt est en la direccin

correcta, otra

14. En cada una de las siguientes muestras aleatorias, determine los intervalos de

confianza de 95 y el 99% para la media poblacional:

i. __X obt = 25, s = 6, N = 15

ii. __X obt = 120, s = 8, N = 30


iii. __X obt = 30.6, s = 5.5, N = 24

iv. Vuelva a resolver la parte a con N = 30. Qu ocurre con el

intervalo de confianza cuando N crece? Otra

15. Supongamos que se desconoce la desviacin estndar poblacional del

problema 21 del captulo 12, pgina 291. Utilice de nuevo = 0.052 Colas, Qu

podra concluir con respecto a la tcnica de la estudiante? Explique la

diferencia entre la conclusin del problema 21 y la de este problema, clnica,

salud.

16. si una variable aleatoria tiene distribucin normal estndar, calcula la

probabilidad de que tome un valor:

(a) menor que 1.50; (b) mayor que 2.16;

(c) mayor que -1.175;

17. escriba el valor de z si la probabilidad de que una variable aleatoria de

distribucin normal estndar tome un valor:

(a) menor que z es 0.9911; (b) mayor que z es 0.1093;

(c) mayor que z es 0.6443; (d) menor que z es 0.0217

e) entre z y z es 0.9298

18. una variable aleatoria tiene una distribucin normal con = 62.4hallar su

desviacin estndar si la probabilidad de que tome un valor mayor que 79.2 es

verifica que

z0.005=2.575

z0.025=1.96

3.5 Bibliografa Complementaria





Primera Edicin













Editorial: Ecoe Ediciones. Quinta Edicin ,Agosto De 1990.

Estadistica de Inferencia. Hctor Anbal Saltos.