METODOS DE ESTIMACION Y DOCIMA DE HIPOTESIS
METODOS DE ESTIMACIONY
DOCIMA DE HIPOTESIS
METODOSLa primera forma de regresiones lineales documentada fue el método
de MCO.El modelo está expresado en forma matemática.Solo se toma una muestra de la realidad.En modelos multiecuacionales las variables tienen diferentes
nombres.Función de regresión poblacional:
iii uXY
REGRESION LINEALMINIMOS CUADRADOS ORDINARIOS
Principio mínimo cuadrático:0
1
2 n
ie
ii XY
1e 2e
4e
3e
Y
X
REGRESION LINEALMINIMOS CUADRADOS ORDINARIOSMINIMOS CUADRADOS ORDINARIOS
Principio mínimo cuadrático:
Debe ser mínimo:
01
2 n
ie
ii uXY
iii YYe iXY
iii XYe
22 )( iiiXYe
REGRESION LINEALMINIMOS CUADRADOS ORDINARIOS
Para hallar las ecuaciones normales:
012
2
))(ˆˆ(ˆ
XiYie
XinYi ˆˆ
0)ˆˆ( XiYi
0))(ˆˆ(2
ˆ
2
iXXiYie
0)ˆˆ( 2iXXXYi
2XXXYi ˆˆ
REGRESION LINEALMINIMOS CUADRADOS ORDINARIOS
El sistema de ecuaciones normales es: XinYi ˆˆ
2ˆˆ XXXYi
XY ˆˆ XY ˆ
22
ii
iiii
xxn
yxyxn
REGRESION LINEALMINIMOS CUADRADOS ORDINARIOS
2xS
yxCovxVarianza
yxCov ),()(
),(
yx SS
yxCovr
),(
y
y
S
Sr
0)1)(ˆˆ(2
ˆ
2
XiYie
REGRESION LINEALMINIMOS CUADRADOS ORDINARIOS
22
2
)(ˆ
XXn
XYXXY
22 )(
ˆXXn
YXXYn
ii eyy
0 ie
0)(
yyi
Y X
62514255515843
70605070556045
Ejemplo de aplicación En una encuesta de hogares (por muestreo estadístico) realizado a 7 familias se obtuvo la siguiente información relativa al ingreso y gasto familiar en bolivianos.
Donde Y= GASTO X= INGRESOCon la anterior información se pide:Para la relación Y=f(x), encontrar la recta de regresión mínimo-cuadrática y estimar el monto del gasto para un ingreso de 100bolivianos.Grafique la nube de puntos y la recta de regresión.
Solucióna) Y=f(X)Gasto=f (ingreso)
Regresión no lineal:
2lnXlnX
lnYlnYlnXlnXβ̂
lnXβ̂lnYα̂ln
(1) de aLinealizadFuncion la Para
2XX
lnYlnYX(Xβ̂
Xβ̂lnYα̂ln
(2) de aLinealizadFuncion la Para
Xβ̂α̂lnlnY
lnXβ̂α̂lnlnY
(2) eα̂Y
(1) Xα̂YXβ̂
β̂
METODO DE MÁXIMA VEROSIMILITUDEste método proporciona estimadores con muchas propiedades deseables, sin embargo es necesario aclarar que los
EMV, no son siempre insesgados (como en el caso de varianzas), pero una sencilla modificación los convierte en estimadores insesgados.
A manera de ilustración supongamos que una urna contiene (X) bolillas azules (a) y (n-x) bolillas blancas (b). en estas condiciones y considerando que por éxito (p), se entiende la probabilidad de extraer al azar una bombilla azul (a), entonces existe las siguientes posibilidades:
¿Cuál de estos resultados posible seria el mejor estimador de la probabilidad de éxito?
La respuesta a esta pregunta se podría dar en términos de un caso particular y mediante la distribución binomial.
Recordando que
Si por ejemplo:
Se puede observar con nitidez que:Cuando x = 0 en la muestra
aleatoria de tamaño 3, se cumple:
Luego
En general, si = estimación de p y = otra estimación de p, entonces:
b) La Función de Verosimilitud y el Estimador Máximo Verosímil (EMV).
Sea
Para constante
FUNCION DE VEROSIMILITUD
De donde que
Estimación de máxima verosimilitud de 0
También
Estimación de máxima verosimilitud de 0
PASOS A SEGUIR PARA LA DOCIMA1. FORMUACION DE HIPOTESIS
2. ESTABLECER EL NI VEL DE SIGNIFICANCIA
3. ESTADISTICO A PRUEBA
4. TOMA DE DECISION (REGLA DE DECISION)
DOCIMACIA DE HIPOTESIS ESTADISTICA.-
No toda hipótesis es una hipótesis estadística, sino solamente aquellas referidas a la distribución
probabilística de una o mas variables aleatorias. Así por ejemplo se puede suponer con intención de ser
sometida a una prueba decisoria, que: a) Una variable aleatoria tiene distribución normal
con parámetros desconocidos b) Una variable aleatoria tiene una distribución
binomial con n=12 y probabilidad de éxito (P) desconocido.
c) Dos variables aleatorias son independientes.
Del cuadro, se deduce que al docimar una hipótesis se puede
tomar la decisión de rechazar cuando verdaderamente es falsa
o se puede incurrir en error cuando se rechaza siendo cierta.
Por el otro lado, se puede aceptar la hipótesis cuando es
verdaderamente cierta o se puede cometer error siendo falsa.
Se concluye: Cuando se rechaza la hipótesis principal, siendo
esta verdaderamente cierta, en este caso se comete el error llamado de TIPO I
Cuando se acepta la hipótesis principal, siendo verdaderamente falsa, en este segundo caso se incurre en el error denominado de TIPO II
EL HECHO REAL
LA DECISION Ho CIERTA Ho FALSA
ACEPTAR: HoDECISION
CORRECTAERROR TIPO II
RECHAZAR: Ho ERROR TIPO IDECISION
CORRECTA
HIPOTESIS RELATIVAS A LA MEDIA DE UNA POBLACION NORMAL. (DOCIMA DE MEDIAS)
a) Se conoce la varianza poblacional
A)
B) Elegir y encontrar el Z, de tablas de la distribución normal tipificada.
01
00
:
:
H
H
2
X
XZc
0
C) Proceder a la determinación del Z calculado con los valores muestrales.
D) Si Entonces se rechaza Ho
E) Concluir, destacando la decisión final en términos del problema planteado.
tc ZZ
a) Se conoce la varianza poblacional
Ejemplo de aplicación:La asociación de dueños de establecimientos comerciales al
detalle de cierta ciudad, en una conferencia de prensa, declaro que el
salario medio por hora de sus empleados es de Bs. 10. Los dirigentes
de un sindicato rubro, sostienen que la Asociación exagera. Frente a
este panorama, la Dirección Distrital del Trabajo, como entidad
reguladora, dispone tomar una muestra aleatoria de 225 sindicalizados
con el resultado de una media de Bs. 9, 10. Asumiendo una
desviación típica de Bs. 5, decida el nivel de significación del 1% ¿Quien tiene
razón? 10:
10:
1
0
H
H323.2
99.0101.0
tZ
A) B)
2
C) Datos
D) Como, 2,703>2,323Entonces, se “RECHAZA Ho”E) La asociación de Dueños de Establecimientos Comerciales al detalle, no tiene razón.
703,2703,2
703,2333,0
9.0
333,0
1010,9
333,015
5
225
5
10 ;10,9X-
225;n 5;σ
c
c
Z
Z
nX
tc ZZ
0,99
0,01
R.A.
0
Z,
Z=2,323
b) No se conoce la varianza poblacional En este caso la única diferencia consiste en utilizar la varianza muestral en sustitución de la varianza
poblacional y como lógica consecuencia se utilizará la
distribución “t” de Student en reemplazo de la distribución normal
tipificada Z.
Ejemplo de Aplicación: De una investigación realizada a 24 familias, de la
zona de Obrajes de la ciudad de La Paz, se sabe que el ingreso familiar promedio durante el año 1995, fue de Bs.
3.245, con una desviación típica de Bs. 412. Docimar la Hipótesis de que el verdadero ingreso
familiar medio en dicha zona, durante 1995, fue de Bs. 4000,
tomando como alternativa que fue distinto de 4000, al 5% de significación.
2
Solución:A)
B)
4000:
4000:
1
0
H
H
07,2)975,0(
95.0105.0
23
t
0.025.0.025.
-2.07 2.070
t
R.A.
98,898,8
98,808,84
755
90,4412755
24
41240003245
? ;3245X-
24;n 412;s
c
c
t
t
n
sX
t
C)
D)
Como tabc tt
8,98>2,07Entonces, se “RECHAZA Ho”
E) El ingreso familiar medio de la zona de Obrajes de la ciudad de La Paz, es diferente a Bs. 4.000.
DOCIMA DE DIFERENCIA DE MEDIAS.-Sean
Cuyas medias son y respectivamente. Dado que X y
Y son variables aleatorias independientes, entonces las
distribuciones de sus medias muestrales, son también
independientemente. Por lo tanto, la distribución de la diferencia de
medias muestrales es:
)(:),,.........,(
)(:),......,,(
);(
);(
221
121
222
211
2
1
nMATYYY
nMATXXX
NY
NX
n
n
2
22
1
21
21 ;)(nn
NYX
DOCIMA DE DIFERENCIA DE MEDIAS.-De modo que cuando y las varianzas poblacionales son conocidas, el estadístico a probar en la dócima es:
(1)
En tanto que si las varianzas poblacionales son desconocidas, y
los tamaños muestrales , el estadístico a utilizar es:
(2)
1;0
2
22
1
21
21 N
nn
YXZ
2
21
21
21
212
211
2121
211
nnt
nnnn
nnsnsn
YX
DOCIMA DE DIFERENCIA DE MEDIAS.-Por último y a manera de aclaración diremos que los denominadores de las anteriores expresiones se refieren
a las desviaciones típicas de la diferencia de medias, o sea:
(3)
Por otro lado, si las varianzas son desconocidas, pero los
tamaños , entonces e estadístico a probar es:
2
2
22
1
21
2121
nnt
n
s
n
s
YX
3y 2en ˆy 1en YXYX
Ejemplo: (Se conocen las varianzas poblacionales)En un estudio sobre el impacto de las escuelas sin ventanas sobre el desarrollo psicológico de los estudiantes, se sometió a una misma prueba de ansiedad a un grupo de 40 niños de una escuela sin ventanas y a otro grupo de 30 niños de una escuela con ventanas, los resultados son:
Si un investigador está dispuesto a rechazar una hipótesis verdadera en no más de 5 veces sobre 100. ¿Podrá concluir que el impacto de los dos tipos de escuelas, respecto a la ansiedad de los estudiantes no es el mismo?
Escuela sin ventanas
Escuela con ventanas
30
12
112
2
2
n
Y
40
10
117
1
1
n
X
Solución del ejemplo0,95
R.A.
0
Z,991,64
64,1
95.0105.0
Z
B)
)1;0(
2
22
1
21
21 N
nn
YXZc
C)
21 021 Dado que por hipótesis, entonces
85,1
7,2
5
30144
40100
112117
2
22
1
21
nn
YXZc
211
210
:
:
H
HA)
D. Como;
tc ZZ
1,85>1,64 Entonces Se “RECHAZA Ho”
E. El impacto sobre la ansiedad de los niños no es el mismo, existe un efecto en la escuela sin ventanas.
DOCIMA DE VARIANZAS
Sabemos; De modo que;
O dicho de otro modo Y Consecuentemente
O sea;
2)1(
1
21
n
Z
2)1(
2
)1,0(
x
Nx
2)1(
2 Z 1;0 NZ
2)1(
2
1
n x
2)1(
2
1
n
n Xx
2)1(
2
1
n
n Xx
(1)
Ejemplo de aplicación
Se posee cierta información sobre la estatura (pulgadas) de 100 estudiantes universitarios, en base al cual se pretende docimar la hipótesis de que la desviación típica es igual a 3 pulgadas. ¿Existirá alguna razón para rechazar la hipótesis al nivel del 5% de significación?
ESTATURAS ESTUDIANTES
60-6263-6566-6869-7172-74
51842278
Solución del ejemplo
52,8100
75,852S ;45,67 2 X
852,756745100
208,0125
214,2450
8,5050175,567
5246,420
0
41,6025
11,9025
0,20256,502530,802
5
305115228141890584
51842278
6164677073
fxfx
2XX
2XXf
9:
9:2
1
20
H
HA)
95,005,01
95.0105.0299
21100
B)
Donde, n es el número de grados de libertad y la variable tipificada de la distribución normal
3
299 999
296,1
999
219995,0
42488,12895,0299
3
21 9
2
9
21
nZ
nn
Z
4,128 4,12895,0 2t
299
R.C
R.A.
0.95
0.05
Utilizando (1)
Por regla general, si entonces se rechaza Ho.
Pero en el caso concreto
94,75>128,4 entonces se “ACEPTA Ho”
No existe razón para rechazar la hipótesis nula al nivel del 5% de significación
75,949
75,852)(2
22
XXfc
C)
22tc
22tc
E)
D)
DOCIMA DE DIFERENCIA DE VARIANZAS Se puede demostrar que si son variables aleatorias independientes, con distribución con n y m grados de libertad respectivamente, entonces: mnF
m
n,""
2)1(2
2
22
)1(22
222
2222
2)1(2
1
22
)1(21
211
1211
22
11
)X-
-(X tambien
)MAT(n );(
)X-
-(X tambien
)MAT(n );(
nn
nn
oSn
yNY
oSn
yNX
y 2
Recordando que sí;
Por otra parte;
Del análisis anterior y si en vez de S2 se utilizara s2, sigue que;
2)1(2
2
22
)1(22
222
2)1(2
1
22
)1(21
211
22
11
)X-
-(X ó
)1(
)X-
-(X ó
)1(
nn
nn
sn
sn
)1();1(
)1()1(
)1()1(
1
)1(
1
)1(
21
22
22
21
21
222
222
121
211
2
22
222
1
21
211
nnFs
s
nsn
nsn
n
sn
n
sn
Consecuentemente;
En resumen, en el caso de docimas de diferencia de varianzas
)1();1(
),0:(
21
22
21
22
21
nnF
Ho
22
21
s
s
:es prueba a oestadistic el :Ho manera otra de dicho o
Ejemplo de aplicación:
La Corporación de Desarrollo del Sudoeste (CORDES), dentro de su programa pecuario ha venido utilizando un sistema de engorde al que desea sustituir por otro. Para este propósito, y debido a que se tiene que realizar inversiones en obras de infraestructura para el nuevo sistema, el personal Técnico del Departamento de Planificación, decide tomar una muestra aleatoria de 31 cabezas de ganado, de modo que pasado cierto lapso de tiempo se mide los resultados obtenidos con el sistema tradicional, arrojando los siguientes datos, una media de engorde por mes de 15 kilos, con una desviación típica de 5 kilos. Por otra parte, se sabe que con una muestra aleatoria de tamaño 61 del hato de la Corporación de Desarrollo del Norte (CORDENO), que practica el nuevo método, dio como resultado una media de 16 kilos, con una desviación de 4 kilos. Suponiendo que ambos hatos son criados en regiones de similares condiciones, temperatura, humedad, etc. ¿habrá alguna razón para pensar que el nuevo sistema es mejor, al nivel del 5% de significación?
Solución del ejemplo22
211
22
210
:
:
H
HA)
R.C
R.A.
0.95
0.05
74,1)95,0()1(
95,0105,0
)60;30()1();1( 21
FFF nnt B)
56,1
5625,116
2522
21
)60;30(
cF
s
sF
C)
La regla de decisión dice que sí:
0H rechaza se tc FF
H acepta se Entonces
1,741,56
0
tc FF
Pero en nuestro caso:
No existe razón suficiente para rechazar la hipótesis nula. Por lo tanto, se puede considerar que ambos sistemas de engorde don iguales
D)
E)
Gracias por su atención lice Ampuero y compañeros