Bioestadística - José Aurelio Pina Romero. · • Repaso de conceptos de Inferencia • Ejercicio 4.3 (mano) • Ejercicio 4.8 (mano – ordenador) ... m5 µ m6 µ X 1 X 2 X 3 X
Post on 13-Aug-2020
32 Views
Preview:
Transcript
Bioestadística
PrácticadeOrdenadores6
1
JoséAurelioPinaRomeroJa.pina@ua.es
Bioestadística– GradoEnfermeríaUA-DepartamentodeEnfermería
¿Quévamoshacer?• RepasodeconceptosdeInferencia• Ejercicio4.3(mano)• Ejercicio4.8(mano–ordenador)• Ejercicio4.12(mano–ordenador)• Ejercicioingestaverduras(mano-ordenador)
2
9
DistribucionesenelmuestreoSi utilizamos una técnica de muestreo para recoger la muestra aleatoria, entonces puede construirse un estimador puntual. Puesto que la muestra es aleatoria:
1. Se pueden obtener muestras.
2. Y para cada una de las muestras se dispondría de un estimador puntual del parámetro poblacional (µ).
Nn
⎛
⎝⎜⎜
⎞
⎠⎟⎟
x
Ω m1
m2
MUESTRA MEDIAMUESTRAL
MEDIAPOBLACIONAL
m1 µ
m2 µ
m3 µ
m4 µ
m5 µ
m6 µ
1X2X3X4X5X6X
Estimador Parámetro
9
Distribucionesenelmuestreo
Puesto que el estimador puntual varía en cada muestra, entonces este estimador es una variable aleatoria. à se puede hallar la estimación de los parámetros poblaciones.
Ω m1
m2
MUESTRA MEDIAMUESTRAL
MEDIAPOBLACIONAL
m1 µ
m2 µ
m3 µ
m4 µ
m5 µ
m6 µ
1X2X3X4X5X6X
Parámetro Estimador
∑=
=n
i
i
nXX
1
9
RecordamosEl parámetro es una característica o medida obtenida mediante el uso de todos los valores de datos de una población específica. (letras griegas) Estimación, es el proceso de estimar el valor de un parámetro a partir de la información obtenida de una muestra. Estimador (o punto estimado) es una estimación de un valor numérico específico de un parámetro utilizando los valores de datos de una muestra. (letras latinas) Un estimador es una cantidad numérica calculada sobre una muestra y que esperamos que sea una buena aproximación de cierta cantidad con el mismo significado en la población (parámetro).
9
RecordamosLos estimadores son características cuantitativas calculadas a partir de los datos de la muestra observada que, por su conducción, intentan acercarse al verdadero valor del parámetro desconocido de la población.
9
Estimadorespuntualesmáximoverosímiles
Parámetro(población) Estimadorpuntual(muestra)
Mediaμ Mediamuestral
Proporciónρ Proporciónmuestral
Varianzaσ² Varianzamuestralcorregida
Diferenciademediasμ1–μ2Diferenciademediasmuestrales
Diferenciadeproporcionesρ1–ρ2Diferenciadeproporcionesmuestrales
nrp == ρ̂
∑=
==n
i
i
nXX
1
µ̂
∑= −
−==
n
i
i
nXxs
1
222
1)(
σ̂
2221 ˆˆ µµ −=− XX
2121 ˆˆ ρρ −=− pp
Dadoqueunestimadoresunav.aleatoria,entoncestienesentidopreguntarse,
8
¿Podría ser conocida la distribución de la probabilidad asociada a cada uno de los estimadores puntuales descritos?
Teoremacentraldellímite
9
TeoremacentraldellímiteTeorema central del límite Sean {X1, ..., Xn} variables aleatorias independientes con media µ y varianza σ2 finita y conocida, entonces
Cuando el tamaño de la muestra fuera lo suficiente grande (n>30)
X =X i
ni =1
n
∑ ~N µ, σn
⎛
⎝⎜
⎞
⎠⎟
Normal estandarizada Si X~N(µ,σ), E[X]=µ VAR[X]= σ2 entonces Z= (X-µ)/ σ ~N(0,1)
X ~N µ, σn
⎛
⎝⎜
⎞
⎠⎟⇒ Z =
X −µ
σ
n
⎛
⎝⎜
⎞
⎠⎟
~N (0,1)
10
Intervalodeconfianzaparalamedia(μ)Definición: Intervalo [a,b] que contiene al verdadero valor de la media (poblacional) con una confianza 1-α. Nótese que α es la probabilidad de error (no contener al parámetro). En el tema de contrastes de hipótesis se llamará probabilidad de error tipo I o nivel de significación. En general el tamaño del intervalo disminuye con el tamaño muestral y aumenta con 1-α. Nivel de confianza es frecuente que se exprese en %
9
Intervalodeconfianzaparalamedia(μ)
-1,96 1,96 P0,025 P0,975
0,95
P (-1,96 < X <1,96) = 0,95
95,0)96,196,1( =<
⎟⎠
⎞⎜⎝
⎛
−<−
n
XPσµ
95,0)96,196,1( =+−<−<−−n
Xn
XP σµ
σ
95,0)96,196,1( =−>>+n
Xn
XP σµ
σ
95,0)96,196,1( =+<<−n
Xn
XP σµ
σ
µ desconocida σ conocida
)1,0(~ N
n
XZ⎟⎠
⎞⎜⎝
⎛
−=
σµ
9
Intervalodeconfianzaparalamedia(μ)
95,0)96,196,1( =+<<−n
Xn
XP σµ
σµ desconocida σ conocida
)1,0(~ N
n
XZ⎟⎠
⎞⎜⎝
⎛
−=
σµ
IC0,95 µ( ) = x −1,96 σ
n,x +1,96 σ
n
⎛
⎝⎜
⎞
⎠⎟
Entonces el 95% de los intervalos que podrían construirse a partir de las diferentes muestras que podrían haberse obtenido por muestreo aleatorio, contendrán al verdadero valor del parámetro poblacional.
IC0,95 µ( ) = x −Zα /2
σ
n,x +Z1−α /2
σ
n
⎛
⎝⎜
⎞
⎠⎟
9
Intervalodeconfianzaparalamedia(μ)
P (X − tα /2n−1 s
n< µ < X + t1−α /2
n−1 sn) = 0,95µ desconocida
σ desconocida
t = X −µ
sn
⎛
⎝⎜
⎞
⎠⎟
~ tn−1
IC0,95 µ( ) = x ± t1−α /2n−1 snN-1 grados de libertad
IC1−α µ( ) = x ± t1−α /2n−1 sn
n>30
Ejercicio4.3Enunestudio realizadoparadeterminarelestadode salud de una comunidad se entrevistó a 82personas, preguntándoles acerca de su actividadfísicahabitual.Delas82personasencuestadas,36de ellas declararon practicar algún deporte deforma regular. Además se les preguntó por lashoras de sueño y los resultados se recogen en lasiguientetabla
14
Realizanejercicio Norealizanejercicio
Nºindividuos 36 46
Mediahorassueño 8.5horas/día 7.2horas/día
D.Típicahorasdesueño 0.9horas 0.8horas
Construya un intervalo de confianza al nivel 0.95 para cada una de las medias de horas de sueño de las dos poblaciones consideradas
Ejercicio4.8EnunestudiosobrelitiasisbiliarrealizadoenGandiayRealdeGandiaseobtuvoinformaciónsobre200individuos.Sabiendoquedelos200individuos92sonhombresy108mujeresyqueelnivelpromediodecolesteroldelos92hombresesde226.58mg/100mlconunadesviacióntípicade49.39,yqueelelnivelpromediodecolesterolentrelas108mujeresfuede228.06mg/100mlconunadesviacióntípicade51.87
15
Construya un intervalo de confianza al nivel 0.99 para el nivel promedio de colesterol poblacional en mujeres.
¿Sería admisible, a la vista del resultado obtenido, un valor promedio de colesterol superior a 235?
Ejercicio4.12El Indice de Quetelet es unamedida de obesidadque se construye a partir del peso y la talla de laforma IQ=peso/talla2. En las 108 mujeresestudiadas(estudiosobrelitiasis)elvalormediodelmencionadoíndicefuede26.87conunadesviacióntípicade4,11.Al 90% de confianza ¿cuánto vale el valor mediopoblacional del Índice de Quetelet en la población demujeresdelaquepartiólamuestra?¿SeríaadmisibleunvalorpromediodelIndicedeQueteletde30? 16
Recordamos–Mediaydesviacióntípica
17
1) Primerohayquesegmentarodividirelarchivo2) AnalizaràEstadísticosdescriptivosàFrecuencias
Recordamos–Mediaydesviacióntípica
18
1) Primerohayquesegmentarodividirelarchivo2) AnalizaràEstadísticosdescriptivosàFrecuencias
Intervalodeconfianzaparalamedia
19
1) Primerohayquesegmentarodividirelarchivo2) AnalizaràCompararmediasàPruebaTparauna…3) PulsamosenOpcionesàintroducimosniveldeconfianza
BBDDLITIABISCalcular el intervalo de confianza al 95% para lamediade las variablespeso, talla y trigliceliridos,tantoparahombrescomoparamujeres.Calcular el intervalo de confianza al 99% para lamediade las variablespeso, talla y trigliceliridos,tantoparahombrescomoparamujeres.Comprueba que el tamaño del intervalo aumentacuandoaumentaelniveldeconfianza.
20
EjercicioingestadeverdurasLatablaadjuntapresentalosvaloresdeingestadeverdura (grs/día) de 30 individuos aleatoriamenteseleccionadosdeunapoblación:280,140,200,380,220,50,150,370,425,140,120,280,360,300,240,150,80,310,210,215,360,250,440,320,290,410,190,360,240,300i. Calcule el intervalo de confianza al 95% para la ingesta media
diariadeverduraenlapoblación.ii. Calcule el intervalo de confianza al 99% para la ingesta media
diariadeverduraenlapoblacióniii. Comparelosresultados.iv. Con una confianza al 95% ¿sería admisible un valor de ingesta
mediadiariade200gr/día?
21
top related