Veter. 11ava estimadores de medias y proporciones

Post on 23-Feb-2017

219 Views

Category:

Education

6 Downloads

Preview:

Click to see full reader

Transcript

ESTIMACIÓN DE

PARÁMETROS

𝐸𝑆 𝑃𝐸𝑆 𝑋

Facultad de Ciencias de la Salud

ESTADÍSTICA

FACULTAD DE CIENCIAS DE LA SALUD – ESCUELA ACADÉMICO PROFESIONAL DE MEDICINA VETERINARIA Y ZOOTECNIA

Dr. Mayhuasca Salgado RonaldDocente

Al término de la clase el estudiante conocerá las bases de la

estadística inferencial sobre estimaciones puntuales y por intervalos

tanto de medias como de proporciones poblacionales

Propósito

Problema tipo

Se desea estimar laproporción de pollosdesnutridos menores de 5semanas al 95% de IC, deuna determinadacomunidad. Para tal efecto,se selecciona una muestrade 100 pollos menores de05 semanas y se determinaque 45 están desnutridos.

¿Por qué hacemos inferencia estadística?

1. Para conocer y concluir algo acerca de una población, a partir de losdatos de una muestra.

2. Si la muestra es aleatoria, los resultados de los datos describen lo queocurre en esa muestra, pero no en la población.

3. Entonces tenemos que inferir (suponer) los resultados de la muestrahacia la población con un cierto margen de incertidumbre (error)

4. Ese proceso de llama INFERENCIA ESTADÍSTICA

Bejarano L, Mormontoy W, Tipacti C. Muestreo e inferencia estadística en ciencias de la salud. Lima: Unión;2006.

Es el proceso por el que se obtienen conclusiones probabilísticasen relación a una población al valerse de la informaciónproporcionada por una muestra de esa población

Parámetro Estadístico

POBLACIÓN

MUESTRA

deducir

inducir

Representativa y probabilística

Estimar (calcular) un parámetro a partir de un

estadístico.

Inferencia estadística

Inferencia es un proceso lógico de naturaleza deductiva o inductivaque permite sacar una conclusión

a partir de una premisa

Procedimiento que permite realizar afirmaciones denaturaleza probabilística respecto a una población, enbase a los resultados obtenidos en una muestraseleccionada de esa población.

Como las poblaciones son descritas por medidas numéricas descriptivas llamadas parámetros, se puede hacer

inferencias acerca de la población haciendo inferenciasrespecto a sus parámetros

Inferencia estadística

INFERENCIA ESTADÍSTICA

Estimación de parámetros

Prueba de hipótesis

Por punto

Por intervalosCalcular un valor que corresponde a una

característica de la población

De orden cuantitativo. Establece conclusiones sobre alguna afirmación o supuesto

(hipótesis)

Establece un rango donde se supone está el

parámetro

Margen de error

EXISTE

Áreas de la inferencia estadística

De parámetros y estimadores

Parámetro Estimador Descripción

µ 𝑋 Media aritmética

σ2 S2 Varianza

µ1 - µ2 𝑋1 - 𝑋2 Diferencia de

medias

π p Proporción

π1 – π2 p1 – p2 Diferencia de proporciones

Se usan las medidas de la muestra para calcular un únicovalor numérico que es la estimación puntual delparámetro poblacional

Las medidas de la muestra pueden también usarse para calcular

dos valores numéricos que definen un intervalo el cual, conun cierto nivel de confianza, se considera que incluye alparámetro

1. Estimación por punto

2. Estimación por intervalo

Se usan las medidas de la muestra para calcular un únicovalor numérico que es la estimación puntual delparámetro poblacional

En un estudio la media y la desviación estándar de las edades de unamuestra de pacientes fueron (33±5 años). Entonces 33 años es laestimación puntual de la edad promedio poblacional.

Pregunta:

¿cuál es la estimación puntual de la desviación estándar y de la varianzade la población de dichos pacientes?

Ejemplo:

1. Estimación por punto

Se necesita estimar el gasto promedio mensual en capacitaciones de loszootecnistas de las diferentes unidades de crianza de animales mayoresde la región. Para tal efecto se recurre a una muestra aleatoria de 25zootecnistas y se obtienen los siguientes resultados:

Media: 1 600 nuevos solesD.E: 320

Ejemplo 02:

1. Estimación por punto

El gasto promedio de todos los zootecnistas estárepresentado por µ (parámetro poblacional) y laestimación por punto de este parámetro sería:

𝑋=1600 n.s.

pero…

… ese valor no es estable, por que si tomamos otra muestra van a haber resultados distintos, ante ello

es mejor determinar un INTERVALO donde “caigan” las distintas medidas paramétricas con un

cierto grado de seguridad

Las medidas de la muestra pueden también usarse para calcular dosvalores numéricos que definen un intervalo el cual, con un cierto nivel deconfianza, se considera que incluye al parámetro

Límite inferior

Límite superior

A veces el parámetro no se halla en el intervalo cuando la muestra no es representativa

Una muestra debe incluir al parámetro

2. Estimación por intervalo

La probabilidad de que una estimación por intervalo incluya el parámetrose denomina nivel de confianza

El modelo general de estimación por intervalo de un parámetro cualquiera, es:

Al restar el producto del estimador se obtiene el límiteinferior del intervalo (LI) y al sumar se obtiene el límitesuperior (LS). La expresión final de la estimación de unparámetro cualquiera es:

IC 95% [LI;LS]

PARÁMETRO = ESTIMADOR ± COEFICIENTE DE CONFIANZA x ERROR ESTÁNDAR DEL ESTIMADOR

El margen de error es grande cuando la muestra es pequeña

A este producto se llama MARGEN DE ERROR O PRECISIÓN DEL ESTIMADOR

O ERROR ABSOLUTO

Parámetro = estimador ± precisión del estimador

2. Estimación por intervalo

Error muestral:

Error y sus tipos

Es la diferencia entre el valor de un estadístico y suparámetro correspondiente, por ejemplo:

Son diversas las causas que lo generan y pueden ser muestrales y no muestrales

Además su cálculo varia cuando se conoce y desconoce la población (N)

|μ - 𝑥 | |π – p |

Error no muestral:

Si tomo varias muestras de una población, para cada una habrá una mediadistinta, esa variabilidad entre muestra y muestra se llama error muestral yse calcula a través de una medida de dispersión llamada error estándar delestimador

Surge de la selección de la muestra, del recuento de toda la población;comprende los sesgos y equivocaciones durante la recolección de datos,codificación y procesamiento de datos.

El error estándar estimado de la media con población finita es:

Los errores cuando conocemos N

Cuantitativo

𝐸𝑆 𝑋=

𝑆

𝑛√

𝑁 − 𝑛

𝑁

Para el 𝐸𝑆 𝑋de toda la población

simplemente multiplicamos por N

El error estándar estimado de la media con población finita es:Cualitativo

𝐸𝑆 𝑝=

𝑝𝑞

𝑛√

𝑁 − 𝑛

𝑁

Para el 𝐸𝑆𝑝 de toda la población simplemente multiplicamos por N

μ = 𝑥 ± Z 1-α/2 . σ

√𝑛

Media aritmética (promedio) poblacional

Media aritmética (promedio) muestral

Coeficiente de confiabilidad:Distribución Z

Desviación estándar poblacional

Límite superior

Límite inferior

Parámetro = estimador ± precisión del estimador

1. Estimación de la media poblacional

Error estándar

Parámetro = estimador ± E (error absoluto)

Cuando conocemos la varianza poblacional (σ2) y n ≥ 30

μ = 𝑥 ± Z 1-α/2 . 𝑆

√𝑛

Media aritmética (promedio) poblacional

Media aritmética (promedio) muestral

Coeficiente de confiabilidad:Distribución Z

Desviación estándar muestral

Límite superior

Límite inferior

Parámetro = estimador ± precisión del estimador

1. Estimación de la media poblacional

Error estándar (N desconocido)

Parámetro = estimador ± E (error absoluto)

Cuando NO conocemos la varianza poblacional (σ2) y n ≥ 30

μ = 𝑥 ± tn-1. 𝑆

√𝑛

Media aritmética (promedio) poblacional

Media aritmética (promedio) muestral

Coeficiente de confiabilidad:Distribución T

Desviación estándar muestral

Límite superior

Límite inferior

Parámetro = estimador ± precisión del estimador

1. Estimación de la media poblacional

Error estándar (N desconocido)

Parámetro = estimador ± E (error absoluto)

Cuando NO conocemos la varianza poblacional (σ2) y n < 30

Donde tn-1 es el coeficiente de confiabilidad, su valor se obtiene de la tabla «t» de Studentcon [n-1] grados de libertad para el nivel de confianza o de significación deseado.

μ = 𝑥 ± tn-1. 𝑆

√𝑛

Límite superior

Límite inferior

Características de la distribución «t» de Student:

• Conformada por una familia de curvas simétricas respecto a laperpendicular en el punto t=0

• Cada curva es diferente de otra en base a los grados delibertad

• A medida que n aumenta, «t» se aproxima a la normalestándar Z.

• Su curva es mas “chata” que la normal y tiene colas másanchas y su μ=0

1. Estimación de la media poblacional

Distribución «t» de Student:

• Conformada por una familia de curvas simétricas respecto a laperpendicular en el punto t=0

• Cada curva es diferente de otra en base a los grados de libertad• A medida que n aumenta, «t» se aproxima a la normal estándar Z.

Se necesita estimar el gasto promedio mensual en capacitaciones de loszootecnistas de las diferentes unidades de producción de animales mayores de laregión. Para tal efecto se recurre a una muestra aleatoria de 25 zootecnistas y seobtienen los siguientes resultados:

Media: 1 600 nuevos solesD.E: 320

Del ejemplo anterior:

Estimación por intervalo

Aquí la distribución t, posee 25-1 grados de libertady para un nivel de significación de 0,05 y para unaprueba de dos colas el t(24)=2,064

Operacionalizando tendremos para:

Li=1467,9 n.s.

Ls= 1732,1 n.s.

Se le asigna un intervalo de confianza de 95%

μ = 𝑥 ± tn-1. 𝑆

√𝑛

Se desea estimar el tiempo promedio de espera de una clínicaprivada veterinaria. En una muestra de 61 usuarios se obtuvouna 𝑋= 18,7 y S=6,8 minutos. Estimar μ con 95% de confianza.

EJEMPLO 02

Solución

Como no se conoce σ (desviación estándar poblacional), el

error estándar de la media muestral se obtiene con S. Entonces: Supuestos: aleatoriedad y

normalidad

μ = 𝑥 ± tn-1. 𝑆

√𝑛

μ = 18,7± t61-1. 6,8

√61

Estimación de la media poblacional

Vamos usar la distribución T, pese a que n>30 para comparar

Se desea estimar el tiempo promedio de espera de una clínica privada veterinaria. Enuna muestra de 61 usuarios se obtuvo una 𝑋= 18,7 y S=6,8 minutos. Estimar μ con 95%de confianza.

EJEMPLO

En este caso, para 60 grados de libertad y un

nivel de significación

bilateral de 0,05 (α =

0,05), se tiene t60=2,00,

luego:

μ = 18,7± t61-1. 6,8

√61μ = 18,7± t60.

6,8

√61

μ = 18,7± (2,00). 6,8

√61

μ = 18,7± 1,7420,4min

17,0min

Estimación de la media poblacional (μ)

Nota: la cantidad ± 1,74 recibe el nombre de

precisión de la estimación o margen de error

Interpretación

El tiempo promedio de espera, para la atención médica en lapoblación de pacientes que acude a la clínica veterinaria, seencuentra entre 17,0 y 20,4 minutos, con un nivel deconfianza de 95%.

Expresión en informe: IC 95% [17,0;20,4] minutos

Estimación de la media poblacional (μ)

Se desea estimar el tiempo promedio de espera de una clínica privadaveterinaria. En una muestra de 61 usuarios se obtuvo una 𝑋= 18,7 y S=6,8minutos. Estimar μ con 95% de confianza.

EJEMPLO

μ = 18,7± 1,70520,40min

16,99min

Al usar la distribución Z, los valores serían:

μ = 18,7± 1,7420,4min

17,0min

π = p ± Z α/2. √𝑝𝑞

𝑛Proporción poblacional

Proporción muestral

Coeficiente de confiabilidad:Distribución Z (bilateral)

p: proporción esperada de individuos con la variable de interés

Límite superior

Límite inferior

Precisión del estimador (margen de error)

Error estándar (N desconocido)

PARÁMETRO

ESTIMADOR

Parámetro = estimador ± precisión del estimador

q =1-p

Estimación de una proporción poblacional (π)N grande o infinita (desconocida)

π = p ± Z α/2. √𝑝𝑞

𝑛(𝑁−𝑛

𝑁−1)Proporción

poblacional

Proporción muestral

Coeficiente de confiabilidad:Distribución Z (bilateral)

p: proporción esperada de individuos con la variable de interés

Límite superior

Límite inferior

Precisión del estimador (margen de error)

Error estándar (N conocido)

PARÁMETRO

ESTIMADOR

Parámetro = estimador ± precisión del estimador

q =1-p

Estimación de una proporción poblacional (π)N finita (o conocida)

Para estimar la prevalencia de obesidad en una población de pacientes desexo femenino se tomó una muestra de 120 individuos de esa población yse encontró que 54 presentaban obesidad. Estimar la prevalenciapoblacional con 95% de confianza.

Solución

Supuestos: muestra probabilística y n > 30

π = p ± Zα/2. √𝑝𝑞

𝑛p = 54/120 = 0,45q = 1- 0,45n = 120α= 1-0,95= 0,05 π = 0,45 ± Z1-0,95. √ 0,45 (0,55)

120

π = 0,45 ± Z0,05. √ 0,45 (0,55)

120

π = 0,45 ± 1,96. √ (0,2475)

120

Z(1-α) : Valor correspondiente en la distribución Z para un nivel de confianza α=…

Estimación de una proporción poblacional (π)

EJEMPLO

Nivel 90% 95% 99%

α 0,10 0,05 0,01

Zα1,28 1,64 2,33

Zα/21,64 1,96 2,57Bilateral

Vemos que no conocemos N

p = 54/120 = 0,45q = 1- 0,45n = 120α= 1-0,95= 0,05

π = 0,45 ± 1,96. √ (0,2475)

120

π = 0,45 ± 0,0890,539

0,361

Expresión en informe:

IC 95% [0,361;0,539] IC 95% [36,1;53,9] %

La prevalencia de obesidad en la población de pacientes de sexofemenino se encuentra entre 36,1 y 53,9%, con 95% de confianza.Respuesta:

Para estimar la prevalencia de obesidad en una población de pacientes desexo femenino se tomó una muestra de 120 individuos de esa población yse encontró que 54 presentaban obesidad. Estimar la prevalenciapoblacional con 95% de confianza.

Estimación de una proporción poblacional (π)

EJEMPLO

Para la aplicación de las estimaciones se requieren cumplir los

supuestos de normalidad y aleatoriedad

Las estimaciones permiten el ahorro de recursos y tiempo en el

proceso de investigación

Conclusiones

Problema tipo

Se desea estimar laproporción de pollosdesnutridos menores de 5semanas al 95% de IC, deuna determinada granja.Para tal efecto, seselecciona una muestra de100 pollos menores de 05semanas y se determinaque 45 están desnutridos.

Tabla de valores críticos de T de Student

g.l

Nivel de significación para prueba de una cola

.10 .05 .025 .01 .005 .0005

Nivel de significación para prueba de dos colas

.20 .10 .05 .02 .01 .001

g.l

Nivel de significación para prueba de una cola

.10 .05 .025 .01 .005 .0005

Nivel de significación para prueba de dos colas

.20 .10 .05 .02 .01 .001

top related