metodo de estimacion y docima de hipotesis

METODOS DE ESTIMACIONY

DOCIMA DE HIPOTESIS

METODOSLa primera forma de regresiones lineales documentada fue el método

de MCO.El modelo está expresado en forma matemática.Solo se toma una muestra de la realidad.En modelos multiecuacionales las variables tienen diferentes

nombres.Función de regresión poblacional:

iii uXY

REGRESION LINEALMINIMOS CUADRADOS ORDINARIOS

Principio mínimo cuadrático:0

1

2 n

ie

ii XY

1e 2e

4e

3e

Y

X

REGRESION LINEALMINIMOS CUADRADOS ORDINARIOSMINIMOS CUADRADOS ORDINARIOS

Principio mínimo cuadrático:

Debe ser mínimo:

01

2 n

ie

ii uXY

iii YYe iXY

iii XYe

22 )( iiiXYe


Para hallar las ecuaciones normales:

012

2

))(ˆˆ(ˆ

XiYie

XinYi ˆˆ

0)ˆˆ( XiYi

0))(ˆˆ(2

ˆ

2

iXXiYie

0)ˆˆ( 2iXXXYi

2XXXYi ˆˆ


El sistema de ecuaciones normales es: XinYi ˆˆ

2ˆˆ XXXYi

XY ˆˆ XY ˆ

22

ii

iiii

xxn

yxyxn


2xS

yxCovxVarianza

yxCov ),()(

),(

yx SS

yxCovr

),(

y

y

S

Sr

0)1)(ˆˆ(2

ˆ

2

XiYie


22

2

)(ˆ

XXn

XYXXY

22 )(

ˆXXn

YXXYn

ii eyy

0 ie

0)(

yyi

Y X

62514255515843

70605070556045

Ejemplo de aplicación En una encuesta de hogares (por muestreo estadístico) realizado a 7 familias se obtuvo la siguiente información relativa al ingreso y gasto familiar en bolivianos.

Donde Y= GASTO X= INGRESOCon la anterior información se pide:Para la relación Y=f(x), encontrar la recta de regresión mínimo-cuadrática y estimar el monto del gasto para un ingreso de 100bolivianos.Grafique la nube de puntos y la recta de regresión.

Solucióna) Y=f(X)Gasto=f (ingreso)

Regresión no lineal:

2lnXlnX

lnYlnYlnXlnXβ̂

lnXβ̂lnYα̂ln

(1) de aLinealizadFuncion la Para

2XX

lnYlnYX(Xβ̂

Xβ̂lnYα̂ln

(2) de aLinealizadFuncion la Para

Xβ̂α̂lnlnY

lnXβ̂α̂lnlnY

(2) eα̂Y

(1) Xα̂YXβ̂

β̂

METODO DE MÁXIMA VEROSIMILITUDEste método proporciona estimadores con muchas propiedades deseables, sin embargo es necesario aclarar que los

EMV, no son siempre insesgados (como en el caso de varianzas), pero una sencilla modificación los convierte en estimadores insesgados.

A manera de ilustración supongamos que una urna contiene (X) bolillas azules (a) y (n-x) bolillas blancas (b). en estas condiciones y considerando que por éxito (p), se entiende la probabilidad de extraer al azar una bombilla azul (a), entonces existe las siguientes posibilidades:

¿Cuál de estos resultados posible seria el mejor estimador de la probabilidad de éxito?

La respuesta a esta pregunta se podría dar en términos de un caso particular y mediante la distribución binomial.

Recordando que

Si por ejemplo:

Se puede observar con nitidez que:Cuando x = 0 en la muestra

aleatoria de tamaño 3, se cumple:

Luego

En general, si = estimación de p y = otra estimación de p, entonces:

b) La Función de Verosimilitud y el Estimador Máximo Verosímil (EMV).

Sea

Para constante

FUNCION DE VEROSIMILITUD

De donde que

Estimación de máxima verosimilitud de 0

También

Estimación de máxima verosimilitud de 0

PASOS A SEGUIR PARA LA DOCIMA1. FORMUACION DE HIPOTESIS

2. ESTABLECER EL NI VEL DE SIGNIFICANCIA

3. ESTADISTICO A PRUEBA

4. TOMA DE DECISION (REGLA DE DECISION)

DOCIMACIA DE HIPOTESIS ESTADISTICA.-

No toda hipótesis es una hipótesis estadística, sino solamente aquellas referidas a la distribución

probabilística de una o mas variables aleatorias. Así por ejemplo se puede suponer con intención de ser

sometida a una prueba decisoria, que: a) Una variable aleatoria tiene distribución normal

con parámetros desconocidos b) Una variable aleatoria tiene una distribución

binomial con n=12 y probabilidad de éxito (P) desconocido.

c) Dos variables aleatorias son independientes.

Del cuadro, se deduce que al docimar una hipótesis se puede

tomar la decisión de rechazar cuando verdaderamente es falsa

o se puede incurrir en error cuando se rechaza siendo cierta.

Por el otro lado, se puede aceptar la hipótesis cuando es

verdaderamente cierta o se puede cometer error siendo falsa.

Se concluye: Cuando se rechaza la hipótesis principal, siendo

esta verdaderamente cierta, en este caso se comete el error llamado de TIPO I

Cuando se acepta la hipótesis principal, siendo verdaderamente falsa, en este segundo caso se incurre en el error denominado de TIPO II

EL HECHO REAL

LA DECISION Ho CIERTA Ho FALSA

ACEPTAR: HoDECISION

CORRECTAERROR TIPO II

RECHAZAR: Ho ERROR TIPO IDECISION

CORRECTA

HIPOTESIS RELATIVAS A LA MEDIA DE UNA POBLACION NORMAL. (DOCIMA DE MEDIAS)

a) Se conoce la varianza poblacional

A)

B) Elegir y encontrar el Z, de tablas de la distribución normal tipificada.

01

00

:

:

H

H

2

X

XZc

0

C) Proceder a la determinación del Z calculado con los valores muestrales.

D) Si Entonces se rechaza Ho

E) Concluir, destacando la decisión final en términos del problema planteado.

tc ZZ

a) Se conoce la varianza poblacional

Ejemplo de aplicación:La asociación de dueños de establecimientos comerciales al

detalle de cierta ciudad, en una conferencia de prensa, declaro que el

salario medio por hora de sus empleados es de Bs. 10. Los dirigentes

de un sindicato rubro, sostienen que la Asociación exagera. Frente a

este panorama, la Dirección Distrital del Trabajo, como entidad

reguladora, dispone tomar una muestra aleatoria de 225 sindicalizados

con el resultado de una media de Bs. 9, 10. Asumiendo una

desviación típica de Bs. 5, decida el nivel de significación del 1% ¿Quien tiene

razón? 10:

10:

1

0

H

H323.2

99.0101.0

tZ

A) B)

2

C) Datos

D) Como, 2,703>2,323Entonces, se “RECHAZA Ho”E) La asociación de Dueños de Establecimientos Comerciales al detalle, no tiene razón.

703,2703,2

703,2333,0

9.0

333,0

1010,9

333,015

5

225

5

10 ;10,9X-

225;n 5;σ

c

c

Z

Z

nX

tc ZZ

0,99

0,01

R.A.

0

Z,

Z=2,323

b) No se conoce la varianza poblacional En este caso la única diferencia consiste en utilizar la varianza muestral en sustitución de la varianza

poblacional y como lógica consecuencia se utilizará la

distribución “t” de Student en reemplazo de la distribución normal

tipificada Z.

Ejemplo de Aplicación: De una investigación realizada a 24 familias, de la

zona de Obrajes de la ciudad de La Paz, se sabe que el ingreso familiar promedio durante el año 1995, fue de Bs.

3.245, con una desviación típica de Bs. 412. Docimar la Hipótesis de que el verdadero ingreso

familiar medio en dicha zona, durante 1995, fue de Bs. 4000,

tomando como alternativa que fue distinto de 4000, al 5% de significación.

2

Solución:A)

B)

4000:

4000:

1

0

H

H

07,2)975,0(

95.0105.0

23

t

0.025.0.025.

-2.07 2.070

t

R.A.

98,898,8

98,808,84

755

90,4412755

24

41240003245

? ;3245X-

24;n 412;s

c

c

t

t

n

sX

t

C)

D)

Como tabc tt

8,98>2,07Entonces, se “RECHAZA Ho”

E) El ingreso familiar medio de la zona de Obrajes de la ciudad de La Paz, es diferente a Bs. 4.000.

DOCIMA DE DIFERENCIA DE MEDIAS.-Sean

Cuyas medias son y respectivamente. Dado que X y

Y son variables aleatorias independientes, entonces las

distribuciones de sus medias muestrales, son también

independientemente. Por lo tanto, la distribución de la diferencia de

medias muestrales es:

)(:),,.........,(

)(:),......,,(

);(

);(

221

121

222

211

2

1

nMATYYY

nMATXXX

NY

NX

n

n

2

22

1

21

21 ;)(nn

NYX

DOCIMA DE DIFERENCIA DE MEDIAS.-De modo que cuando y las varianzas poblacionales son conocidas, el estadístico a probar en la dócima es:

(1)

En tanto que si las varianzas poblacionales son desconocidas, y

los tamaños muestrales , el estadístico a utilizar es:

(2)

1;0

2

22

1

21

21 N

nn

YXZ

2

21

21

21

212

211

2121

211

nnt

nnnn

nnsnsn

YX

DOCIMA DE DIFERENCIA DE MEDIAS.-Por último y a manera de aclaración diremos que los denominadores de las anteriores expresiones se refieren

a las desviaciones típicas de la diferencia de medias, o sea:

(3)

Por otro lado, si las varianzas son desconocidas, pero los

tamaños , entonces e estadístico a probar es:

2

2

22

1

21

2121

nnt

n

s

n

s

YX

3y 2en ˆy 1en YXYX

Ejemplo: (Se conocen las varianzas poblacionales)En un estudio sobre el impacto de las escuelas sin ventanas sobre el desarrollo psicológico de los estudiantes, se sometió a una misma prueba de ansiedad a un grupo de 40 niños de una escuela sin ventanas y a otro grupo de 30 niños de una escuela con ventanas, los resultados son:

Si un investigador está dispuesto a rechazar una hipótesis verdadera en no más de 5 veces sobre 100. ¿Podrá concluir que el impacto de los dos tipos de escuelas, respecto a la ansiedad de los estudiantes no es el mismo?

Escuela sin ventanas

Escuela con ventanas

30

12

112

2

2

n

Y

40

10

117

1

1

n

X

Solución del ejemplo0,95

R.A.

0

Z,991,64

64,1

95.0105.0

Z

B)

)1;0(

2

22

1

21

21 N

nn

YXZc

C)

21 021 Dado que por hipótesis, entonces

85,1

7,2

5

30144

40100

112117

2

22

1

21

nn

YXZc

211

210

:

:

H

HA)

D. Como;

tc ZZ

1,85>1,64 Entonces Se “RECHAZA Ho”

E. El impacto sobre la ansiedad de los niños no es el mismo, existe un efecto en la escuela sin ventanas.

DOCIMA DE VARIANZAS

Sabemos; De modo que;

O dicho de otro modo Y Consecuentemente

O sea;

2)1(

1

21

n

Z

2)1(

2

)1,0(

x

Nx

2)1(

2 Z 1;0 NZ

2)1(

2

1

n x

2)1(

2

1

n

n Xx

2)1(

2

1

n

n Xx

(1)

Ejemplo de aplicación

Se posee cierta información sobre la estatura (pulgadas) de 100 estudiantes universitarios, en base al cual se pretende docimar la hipótesis de que la desviación típica es igual a 3 pulgadas. ¿Existirá alguna razón para rechazar la hipótesis al nivel del 5% de significación?

ESTATURAS ESTUDIANTES

60-6263-6566-6869-7172-74

51842278

Solución del ejemplo

52,8100

75,852S ;45,67 2 X

852,756745100

208,0125

214,2450

8,5050175,567

5246,420

0

41,6025

11,9025

0,20256,502530,802

5

305115228141890584

51842278

6164677073

fxfx

2XX

2XXf

9:

9:2

1

20

H

HA)

95,005,01

95.0105.0299

21100

B)

Donde, n es el número de grados de libertad y la variable tipificada de la distribución normal

3

299 999

296,1

999

219995,0

42488,12895,0299

3

21 9

2

9

21

nZ

nn

Z

4,128 4,12895,0 2t

299

R.C

R.A.

0.95

0.05

Utilizando (1)

Por regla general, si entonces se rechaza Ho.

Pero en el caso concreto

94,75>128,4 entonces se “ACEPTA Ho”

No existe razón para rechazar la hipótesis nula al nivel del 5% de significación

75,949

75,852)(2

22

XXfc

C)

22tc

22tc

E)

D)

DOCIMA DE DIFERENCIA DE VARIANZAS Se puede demostrar que si son variables aleatorias independientes, con distribución con n y m grados de libertad respectivamente, entonces: mnF

m

n,""

2)1(2

2

22

)1(22

222

2222

2)1(2

1

22

)1(21

211

1211

22

11

)X-

-(X tambien

)MAT(n );(

)X-

-(X tambien

)MAT(n );(

nn

nn

oSn

yNY

oSn

yNX

y 2

Recordando que sí;

Por otra parte;

Del análisis anterior y si en vez de S2 se utilizara s2, sigue que;

2)1(2

2

22

)1(22

222

2)1(2

1

22

)1(21

211

22

11

)X-

-(X ó

)1(

)X-

-(X ó

)1(

nn

nn

sn

sn

)1();1(

)1()1(

)1()1(

1

)1(

1

)1(

21

22

22

21

21

222

222

121

211

2

22

222

1

21

211

nnFs

s

nsn

nsn

n

sn

n

sn

Consecuentemente;

En resumen, en el caso de docimas de diferencia de varianzas

)1();1(

),0:(

21

22

21

22

21

nnF

Ho

22

21

s

s

:es prueba a oestadistic el :Ho manera otra de dicho o

Ejemplo de aplicación:

La Corporación de Desarrollo del Sudoeste (CORDES), dentro de su programa pecuario ha venido utilizando un sistema de engorde al que desea sustituir por otro. Para este propósito, y debido a que se tiene que realizar inversiones en obras de infraestructura para el nuevo sistema, el personal Técnico del Departamento de Planificación, decide tomar una muestra aleatoria de 31 cabezas de ganado, de modo que pasado cierto lapso de tiempo se mide los resultados obtenidos con el sistema tradicional, arrojando los siguientes datos, una media de engorde por mes de 15 kilos, con una desviación típica de 5 kilos. Por otra parte, se sabe que con una muestra aleatoria de tamaño 61 del hato de la Corporación de Desarrollo del Norte (CORDENO), que practica el nuevo método, dio como resultado una media de 16 kilos, con una desviación de 4 kilos. Suponiendo que ambos hatos son criados en regiones de similares condiciones, temperatura, humedad, etc. ¿habrá alguna razón para pensar que el nuevo sistema es mejor, al nivel del 5% de significación?

Solución del ejemplo22

211

22

210

:

:

H

HA)

R.C

R.A.

0.95

0.05

74,1)95,0()1(

95,0105,0

)60;30()1();1( 21

FFF nnt B)

56,1

5625,116

2522

21

)60;30(

cF

s

sF

C)

La regla de decisión dice que sí:

0H rechaza se tc FF

H acepta se Entonces

1,741,56

0

tc FF

Pero en nuestro caso:

No existe razón suficiente para rechazar la hipótesis nula. Por lo tanto, se puede considerar que ambos sistemas de engorde don iguales

D)

E)

Gracias por su atención lice Ampuero y compañeros

metodo de estimacion y docima de hipotesis

Education