26 ESTADÍSTICA Y PROBABILIDAD 10.1.1 Estimación puntual Un estimador es un elemento descriptivo basado en las mediciones contenidas en una muestra. Por ejemplo, la media de la muestra x n x i i n = = ∑ 1 1 es un estimador puntual para la media de la población µ 0 . Supóngase que se quiere obtener una inferencia respecto de la calificación media de todos los alumnos que cursan la materia de cálculo, para esto se analiza una muestra aleatoria de diez de ellos, cuyas calificaciones son 8, 4, 9, 9, 6, 8, 2, 7, 3 y 6 Mediante el promedio de los datos de una muestra se calcula un valor para el estadístico X x = + + + + + + + + + = 1 10 8 4 9 9 6 8 2 7 3 6 62 ( ) . Con base en el valor calculado del estadístico X se puede llevar a cabo una inferencia respecto del parámetro µ, es decir, una estimación puntual del parámetro media respecto de las calificaciones de la materia de cálculo. En este caso la calificación promedio es 6.2. En general Dada una población en donde θ es un parámetro, y ˆ Θ su estadística correspondiente, se le llama estimador puntual de θ a cualquier valor ˆ θ de ˆ Θ. De la definición de estimador puntual no se puede esperar que dicho valor realice una estimación certera del parámetro, de hecho, ésta también depende del estadístico utilizado. Por ejemplo, si la población estudiantil de la materia de cálculo tiene calificación promedio µ = 6.5, y se considera una muestra al azar de tres estudiantes con calificaciones 3, 6 y 6, para realizar una estimación del parámetro, se tiene x = + + = 1 3 3 6 6 5 ( ) Es decir, el estadístico media difiere del parámetro en 1.5 unidades, mientras que el estadístico mediana x = 6, difiere del parámetro en sólo 0.5. Por tanto, con la muestra anterior, el estadístico mediana estima mejor el parámetro. Pero, qué pasará si en una segunda muestra aleatoria de tamaño tres, las calificaciones para la estimación del parámetro resultan 4, 4, y 10, se tiene x = + + = 1 3 4 4 10 6 ( ) Por tanto, para esta muestra el estadístico media difiere del parámetro en 0.5 unidades, mientras que el estadístico x = 4, difiere del parámetro en 2.5. Es decir, con la muestra anterior el estadístico media estima mejor el parámetro. Por tanto, puede ser de interes qué estimador puntual para un mismo parámetro es mejor elegir. La respuesta se encuentra en las siguientes definiciones. Definición 10.1
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
1. Dadas X1, X2, X3 y X4 una muestra aleatoria seleccionada de una poblacióndistribuidaen formanormalconmediaµ ydesviaciónestándarσ, considera lossiguientesestimadoresdeµ
a) compruebaqueX Y− esunestimadorinsesgadodeµ1yµ2 b) calculalavarianzadelestimadorX Y−
10.1.2 Estimación por intervalo
Despuésde iniciadoel estudiode los estimadorespuntuales es lógico suponerque lainferencia realizadamedianteun valorpuntualno es lamás adecuada, yaquepuedevariar considerablemente de muestra en muestra, por tanto, es preferible indicar unintervalo enelque sepueda estimar, con cierto grado de confianza, la localizacióndelparámetroenestudio.
Dada θ como parámetro, supóngase que, bajo ciertas condiciones (como se veráenlassiguientessubsecciones),seencuentraqueθ θ θ∈ ( ˆ , ˆ )i s ,dondelospuntosextremosˆ ˆθ θi sy llamados extremo inferior y extremo superior, respectivamente, dependen del
valor de la estadística Θ̂ para una muestra particular. Como los extremos ˆ ˆθ θi sy delintervalodependendelamuestra,resultaquesólosonvaloresdelasvariablesaleatoriascorrespondientes ˆ ˆΘ Θi sy . Con base en las variables aleatorias anteriores y sus valorescorrespondientes, se calcula la probabilidad de que el parámetro θ se encuentre en elintervaloestablecido.Sesimbolizapor1–αconα∈(0,1)alaprobabilidadmencionada
El intervalo anterior en el que se localiza el parámetro θ, ˆ ˆΘ Θi s< <θ , se llama intervalo de confianza de (1 – α)100%; mientras que la fracción 1 – α se le llama coeficiente o grado de confianza y los extremos ˆ ˆθ θi sy , son los límites de confianza inferior y superior, respectivamente.
Porejemplo,setieneunamuestrade20focoscuyaduraciónpromedioenhorases x = 750yconbaseenestevalorseestimaqueelparámetroµpuedeencontrarseconunaprobabilidad1–α,establecidadeantemanoenelintervalodeconfianza(740,760),esdecir
P( )740 760 1< < = −µ α
En las siguientes subsecciones se analizarán los intervalos de confianza máscomunesparalosparámetros,medias,diferencia de medias,varianzasyproporciones.
¿Qué es una estimación por medio de un intervalo?
Definición 10.4
2�0 Estadística y probabilidad
Intervalos de confianza para medias de poblaciones aproximadamente normales
1. Intervalo de confianza para la media poblacional µ con distribución normal, cuando se conoce σ.
Dada x la media de una muestra aleatoria de tamaño n de una población condistribución aproximadamente normal, de la cual se conoce σ 2, el intervalo deconfianza(1–α)de100%paraµestádadopor
x zn
x zn
−
< < +
α α
σµ
σ
2 2
dondezα/2eselvalordeladistribuciónnormalestándar,aladerechadelcualtieneunáreadeα/2. Sedenotaenestecasoqueparapoderaplicarlafórmula,ladistribucióntienequesernormaloaproximadamentenormalyse debe conocer el parámetro σ.
Una máquina de refrescos está ajustada de tal manera que la cantidad de líquidosuministrado se distribuye en forma normal con desviación estándar de 0.15 dl. Secalcula95%deintervalodeconfianzaparalamediaderefrescosservidosdeunamuestrade36vasostomadaalazarconuncontenidopromediode2.25dl.
Setomanlosdatos:σ=0.15dl,eltamañodelamuestraes36conmediamuestralde x = 2 25. dl.Paracalcularelintervalodeconfianzadelparámetromediaseemplealafórmulaanterior.
2. Intervalo de confianza para la media poblacional µ cuando se desconoce σ en muestras grandes.
Dada x lamediadeunamuestraaleatoriadetamañon(n≥30)tomadaalazardeunapoblacióndelacualseconocesudesviaciónestandar sysedesconoceσ,elintervalodeconfianza(1–α)de100%paraµestádadopor
x zs
nx z
s
n−
< < +
α αµ
2 2
Ejemplo 3
2�1Unidad 10 • infErEncia Estadística
dondezα/2eselvalordeladistribuciónnormalestándar,lacualtieneunáreadeα /2ysesladesviaciónestándarobtenidadelestadísticovarianzainsesgada. Enestecasoesposiblenotarqueparapoderaplicarlafórmula,adiferenciadelanterior,sedesconoce la distribución.
Setieneunamáquinaderefrescoscomoenelejemploanterior,perodelacualsedesconocesudesviaciónestándar.Paraestimarlacantidadpromediodelíquidosuministradoporlamáquinasetomaunamuestraalazarde50vasos,conmediade240mlydesviaciónestándarde20. Se calcula99%de intervalode confianzapara lamediade refrescosservidos.
Setomanlosdatos:eltamañodelamuestraes50, x = 240ys=20ml.Elintervalodeconfianzadelparámetromediaseobtienesustituyendoestosvaloresen la fórmulaanterior.
3. Intervalo de confianza para la media poblacional µ cuando se desconoce σ en muestras pequeñas.
Dada x lamediadeunamuestradetamañon(n<30)tomadaalazardeunapoblacióncondistribuciónnormaldelacualseconoces2,ysedesconoceσ 2,elintervalodecon-fianza(1–α)de100%paraµestádadopor
Es decir, con 99.9% de probabilidad se determina que el parámetro media dellíquidosuministradoporlamáquinaderefrescosseencuentraentre241.79y250.75ml.Portanto,laafirmacióndelfabricantenoseráválidacon99%deconfianza,puestoqueelvalor240mlestáfueradelintervalo.
3. Mientrasseefectúaunatareadeterminadaencondicionessimuladasdeausenciadegravedadelritmocardiacode40astronautasenadiestramientoseincrementa,26.4pulsacionesporminutoenpromediocondesviaciónestándarde4.28,calculalaverdaderamediaenelincrementodelritmocardiacosi x = 26 4. seutilizacomounaestimaciónpuntualdelincrementomedioenelritmocardiacoyseutiliza95%deconfianza.
4. Se realizan cinco mediciones en un medidor de volumen en la bomba de unaestacióndegasolina(10.5,10.0,9.90,9.95y10.15),supónnormalidadycalculaunintervalodeconfianzaparalamediaconα=0.05
Siµ1yµ2sonresistenciaspromedioalatensión,delostornillostipoIytipoII,respectivamente, se calcula 95% de intervalo de confianza para µ1– µ2 con el fin dedeterminarconcuáltipodetornillosesmásresistente.
4. Intervalo de confianza para µ1 – µ2 de poblaciones normales cuando se desconocen
σσ σσ12
22y , pero se sabe que σσ ≠≠ σσ1
222 en muestras pequeñas.
Dadas x x1 2y lasmediasdemuestrasaleatoriasindependientesdetamañosn1yn2(n1<30yn2<30),respectivamente,depoblacionesaproximadamentenormalesdondesedesconocenσ σ1
222y perosesabequeσ σ1
222≠ ,elintervalodeconfianza
(1–α)de100%paraµ1–µ2estádadopor
( ) ( )x x ts
n
s
nx x t
s
n
s
n1 22
12
1
22
21 2 1 2
2
12
1
22
2− − + < − < − + +α αµ µ
Ejemplo �
2�6 Estadística y probabilidad
dondetα/2eselvalordeladistribuciónt-Studentcon
ν =
+
−
+
sn
sn
sn n
sn
12
1
22
2
2
12
1
2
1
22
2
11
−
2
2
11n
gradosdelibertad,elcualtieneunáreadeα/2,y s s12
22y sonlasvarianzasinsesgadas
respectivasdelasmuestras. De la fórmula anterior sepuede estimarque el resultadodel cálculode losgradosdelibertadgeneralmenteseráunacantidad no entera,porloquesiemprese debe redondear al entero más próximo(noalsiguiente),porejemplo,siv =14.3≈14;v =14.7≈15;v =14.5≈15.
Se retoman los datos del ejemplo 8, considerando que σ σ12
Falta determinar, usando las tablas porcentuales de la distribución t-Student, elvalordetα/2con90%deconfianza(α=0.10esdecir,α/2=0.05)yv=15gradosdelibertad.Sedeterminaenlastablascorrespondientesquet0.05=1.753.
5. Intervalo de confianza para µd = µ1 – µ2 de poblaciones normales, cuando se desconocen σσ σσ1
222y , pero se sabe que son observaciones por pares en muestras pequeñas.
Dadas x sd dy la media y la desviación estándar de las diferencias normalmentedistribuidas de n pares aleatorios y dependientes de mediciones de muestras detamaño n(n < 30), respectivamente, de poblaciones aproximadamente normales
En un proceso químico se comparan dos catalizadores para comprobar su efecto en elresultadodelareacción.SepreparóunamuestradedoceprocesosutilizandoelcatalizadormarcaL y tambiéndocede lamarca M; a continuación semuestran losdatos con losrendimientos.
Eltamañodelamuestraesdiez,porconsiguientelosgradosdelibertadv=10–1=9.De las tablasporcentualescorrespondientesa ladistribución t-Studentcon99%decon-fianza(α=0.01yα/2=0.005),setienequet0.005=3.25.Porúltimoelintervalodeconfianzaresulta
0 074 3 250 207
100 074 3 25
0 207
10
0 139
. ..
. ..
.
−
< < +
− <
µ
µ
d
dd < 0 287.
Ejercicio 3
1. Calcula si enunaclasedediezestudiantessetieneelmismorendimientoendospruebasdiferentes.Suspuntuacionesson
Calcula las medias de estas poblaciones con 99% de intervalo de confianza;supónquelasvarianzaspoblacionalessondiferentesyquesudistribuciónesaproxima-damentenormal.
4. Se realizan cinco mediciones en un medidor de volumen en la bomba de unaestacióndegasolina(10.5,10.0,9.90,9.95y10.15),supónnormalidadycalculaunintervalodeconfianzaparalavarianzaconα=0.05.
Intervalos de confianza para las proporciones en muestras grandes
1. Intervalo de confianza para el parámetro p en muestras grandes.
Enunamuestraaleatoriadecienposiblesclientes,70prefierendeterminadoproducto.Se considera95%de intervalode confianzapara la proporciónde todos losposiblesclientesqueprefierentalproducto.
1. Para estimar la propuesta de los trabajadores desempleados en Panamá, uneconomistatomaunamuestraalazarde400personasdeclaseobrera,donde25resultaronsinempleo.CalculalaproporciónrealdetrabajadoresdesempleadosenPanamáconsiderando97%deunintervalodeconfianza.
2. Unrector registródebidamenteelporcentajedecalificacionesD yFotorgadasalosestudiantespordosprofesoresuniversitariosdehistoria.ElprofesorIalcanzó32% contra 21% del profesor II, con 200 y 180 estudiantes, respectivamente.Considera90%deintervalodeconfianzaparaladiferenciadeproporciones.
3. Un antropólogo está interesado en la proporción de individuos que presentanbraquicefaliaendostribusindígenas.Supónquesetomanmuestrasindependientesdecadaunadelastribusysedescubreque24decada100nativosdelatribuAy36decada120delatribuBposeendichacaracterística.Considera95%deintervalodeconfianzaparaladiferenciap1–p2entrelasproporcionesdeestasdostribus.
10.2 Pruebas de hipótesis
En la sección anterior se analizaron los intervalos de confianza para el cálculo deestimacionessobrelosparámetrosyparatomardecisionesaltrabajarconlapoblacióndeinterés.Enestasecciónseestudiaráotrométodoestadísticoquepermitatomardeci-sionesenproblemasrelacionadosconpoblacionesqueresultanmuydifícilesoimposiblesdeanalizarensutotalidad.Porejemplo,parapoderconcluirconciertaveracidadsobrela