1 El An´ alisis de Varianza Objetivo: Explicar (controlar) las variaciones de una v.a. Y continua (num´ erica), mediante factores (variables cualitativas que definen categor´ ıas) que controlamos (no aleatorios). Este an´ alisis permite poner en evidencia eventuales relaciones entre Y y estos factores. 1.1 An´ alisis con un solo factor 1.1.1 Un ejemplo Queremos estudiar la influencia de la operadora sobre el importe de nuestra factura anual de tel´ efono (Y ). Denotamos: m 1 el valor medio de Y con la operadora 1. m 2 el valor medio de Y con la operadora 2. m 3 el valor medio de Y con la operadora 3. PREGUNTA: ¿ m 1 = m 2 = m 3 ?Disponemos de datos que corresponden al gasto anual de tel´ efono en Euros (Y ) de 15 clientes: Operadora 1 Operadora 2 Operadora 3 750 800 950 800 850 850 810 880 820 815 890 900 815 900 820 Medias 798 864 868 Vocabulario : • Y =”Gasto anual de tel´ efono” es una variable cuantitativa. • La Operadora es una variable cualitativa con la cual queremos explicar las variaciones de Y : un factor. 1
25
Embed
1 El An´alisis de Varianza - Departamento de Estadísticahalweb.uc3m.es/.../personas/nunez/esp/statII/notas/analisis.pdf · 1.1.3 Estimaci´on de los par´ametros del modelo El modelo
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
1 El Analisis de Varianza
Objetivo: Explicar (controlar) las variaciones de una v.a. Y continua(numerica), mediante factores (variables cualitativas que definen categorıas)que controlamos (no aleatorios). Este analisis permite poner en evidenciaeventuales relaciones entre Y y estos factores.
1.1 Analisis con un solo factor
1.1.1 Un ejemplo
Queremos estudiar la influencia de la operadora sobre el importe de nuestrafactura anual de telefono (Y ).
Denotamos:
m1 el valor medio de Y con la operadora 1.
m2 el valor medio de Y con la operadora 2.
m3 el valor medio de Y con la operadora 3.
PREGUNTA: ¿ m1 = m2 = m3 ?Disponemos de datos que correspondenal gasto anual de telefono en Euros (Y ) de 15 clientes:
• Y =”Gasto anual de telefono” es una variable cuantitativa.
• La Operadora es una variable cualitativa con la cual queremos explicarlas variaciones de Y : un factor.
1
• Los factores tienen un cierto numero de niveles. El factor Operadoratiene aquı 3 niveles.
Notaciones:
• yij valor observado de Y para el jesimo cliente de la iesima operadora,i = 1, . . . , I, j = 1, . . . , ni = 5; y13 = 810.
• yi• media observada de Y para la iesima operadora; y2• = 864.
• y•• media global observada de Y (media de las medias); y•• = 13(y1• + y2• + y3•) =
843.3.
Indicios para medir la variabilidad:Variabilidad explicada por el factor:
V E =I∑
i=1
ni (yi• − y••)2
Variabilidad no explicada:
V NE =I∑
i=1
ni∑j=1
(yij − yi•)2
Descomposicion de la variabilidad total:
V T =I∑
i=1
ni∑j=1
(yij − y••)2
= V E + V NE
Con los datos precedentes, obtenemos los valores
V E = 22230, V NE = 15453.33
V T = 22230 + 15453.33 = 37683.33
2
1.1.2 El Modelo
Para contestar a nuestra pregunta (¿m1 = m2 = m3?) consideramos quecada dato observado yij es igual al valor medio en el nivel del factor que lecorresponde (mi) mas una desviacion aleatoria εij (o perturbacion) respectoa este valor medio: Para i = 1, . . . , I y j = 1, . . . , ni tenemos
yij = mi + εij
Supondremos que las desviaciones εij = yij −mi, verifican las hipotesis sigu-ientes:
• Las desviaciones estan centradas: E(εij) = 0, para cualquier i, j.
• Homocedasticidad: Var(εij) = σ2, para cualquier i, j.
• No correlacion: E(εijεik) = 0, para cualquier i, j, k.
• Normalidad: εij tiene una distribucion normal, para cualquier i, j.
Otra formulacion del modelo:
yij = µ + αi + εij,
donde
• µ = 1n
∑Ii=1 nimi es el efecto global (o medio).
• αi = mi − µ es el efecto del iesimo nivel del factor.
• Necesariamente∑
i niαi = 0.
Con esta nueva formulacion nuestra pregunta se puede escribir:
¿α1 = α2 = α3 = 0?
3
1.1.3 Estimacion de los parametros del modelo
El modelo depende de I + 1 parametros: Las I medias mi, y la varianzacomun σ2.
Para estimar estos parametros utilizamos el criterio de mınimos cuadrados(minimizar las desviaciones): Para cada i = 1, . . . , I,
mi valor de mi que mınimiza
ni∑j=1
(yij −mi)2 ,
Obtenemos:
• mi = yi•
Deducimos que
• µ = y••
• αi = mi − µ = yi• − y•• (en el ejemplo: α1 = −45.33 y α2 = 20.66)
Propiedad de los estimadores: Bajo las hipotesis del modelo, tenemos
que mi = yi• sigue una distribucion normal N(mi,
σ2
ni
).
Prueba:
• E(yi•) =E(
1ni
∑ni
j=1 yij
)= 1
ni
∑ni
j=1E(yij) = mi
• var(yi•) =var(
1ni
∑ni
j=1 yij
)= 1
n2i
∑ni
j=1var(yij) = σ2
ni
• yi• es una combinacion lineal de variables normales, por tanto es tambiennormal.
Deducimos que µ sigue una normal N(µ, σ2
n) y αi una normal N
(αi,
(I−1)n
σ2)
.
4
Estimacion de los residuos: Las desviaciones observadas eij (residuosdel modelo) se calculan por:
eij = yij − mi
= yij − yi•
Por tanto, tenemos que
V E =I∑
i=1
niα2i
V NE =I∑
i=1
ni∑j=1
e2ij
Grados de libertad:Definicion: Numero de variables linealmente independientes utilizadas
para describir una dispersion..Utilidad: Numeros con los cuales es necesario dividir los indicios de
variabilidad (VE;VNE) para
• compararlos.
• obtener las varianzas.
Estimacion de las varianzas:
V E esta calculada con I − 1 variables linealmente independientes, puestoque
∑Ii=1 niαi = 0. Por tanto, si α1 = . . . = αI = 0, 1
σ2 V E sigue,Bajo H0, una distribucion del χ2 con I − 1 grados de libertad.
V NE esta calculada con n− I variables linealmente independientes, puestoque
∑ni
j=1 eij = 0, para cada i. Por tanto, 1σ2 V NE sigue una dis-
tribucion del χ2 con n− I grados de libertad.
Ademas se puede demostrar que V E y V NE son independientes.
Por consiguiente,
5
• La varianza explicada por el modelo σ2e (o varianza inter-niveles) esta
estimada por
s2e =
V E
I − 1
• La varianza no explicada por el modelo σ2R (o varianza residual) esta
estimada por
s2R =
V NE
n− I
1.1.4 El contraste de igualdad de medias
Queremos contrastar las hipotesis:
H0 :
{”Las mi son iguales”:m1 = m2 = . . . = mI .
}frente a
H1 :
{”No todas las mi son iguales”:Existe i, k, tal que mi 6= mk.
}
O de manera equivalente,H0 : {α1 = α2 = . . . = αI = 0}
frente aH1 : {Existe i, tal que αi 6= 0.}
Rechazaremos H0 cuando el factor explica “poca” variabilidad. Basamosnuestra decision sobre el ratio
F =s2
e
s2R
,
y rechazaremos H0 cuando F es “grande”.
Pero ¿Como de grande?
Bajo las condiciones sobre las desviaciones εij (independencia, homo-cedasticidad, normalidad), tenemos que si H0 es cierto el estadıstico F sigueuna distribucion de Fisher con (I − 1, n− I) grados de libertad.
6
Por tanto rechazamos H0 si
F > f 1−α(I−1,n−I),
donde α es el nivel (o tamano) del test y fα(I−1,n−I) el valor tal que P
(F > f 1−α
(I−1,n−I) |H0 es cierto)
=α.
Tabla ADEVA: Se resume la descomposicion de la variabilidad de losdatos en la tabla siguiente:
Fuentes deVariaciones
Suma de cuad. Gr. de lib. Varianzas F
Entreniveles
V E I − 1 s2e = V E
I−1F = s2
e
s2R
Internao residual
V NE n− I s2R = V NE
n−I
Total V T n− 1 s2y = V T
n−1
Con los datos anteriores obtenemos:
Fuentes deVariaciones
Suma de cuad. Gr. de lib. Varianzas F
Entreniveles
15453.33 2 7726.66 4.17
Internao residual
22230.00 12 1852.50
Total 37683.33 14 2691.66
Para α = 5%, consultando la tabla de la Fisher(2, 12) , obtenemos f 0.05(I−1,n−I) =
3.885, por tanto rechazamos H0.
7
El p−valor: Medida de la credibilidad de H0, en nuestro ejemplo: p =
P(F > F |H0
)' .0.04
Coeficiente de determinacion: Una medida relativa de la variabilidadexplicada por el modelo es el cociente: R = V E
V Ty por tanto, 0 ≤ R ≤ 1.
Analisis de las diferencias entre medias Si la hipotesis de igualdad demedias (H0) se rechaza, tiene interes estimar las diferencias entre las cat-egorıas.. Se puede construir un intervalo de confianza para la diferenciami − mj mediante la distribucion de mi − mj = yi• − yj•. Tenemos que
yi• − yj• ∼ N(mi −mj, σ
2(
1ni
+ 1nj
)), por tanto:(
yi• − yj•)− (mi −mj)√
s2R
(1ni
+ 1nj
) ∼ t(n− I)
Por consiguiente, deducimos el intervalo de confianza 1 − α de la diferencia(mi −mj): [(
yi• − yj•)± t
(n−I)α/2
√s2
R
(1
ni
+1
nj
)]
1.2 Analisis con dos factores
1.2.1 Un ejemplo
Estudio de la cantidad de cerveza bebida (Y ) por los alumnos durante lafiesta de fin de ano, en funcion del sexo y del curso.
Las Preguntas:
• ¿Los chicos beben mas que las chicas?
• ¿Los alumnos de Economıa y Derecho beben mas que los alumnos deAdministracion y Empresa?
• ¿Existe una ”interaccion” entre sexo y curso?
8
Datos (n = 18 alumnos) cantidad en litro.
Derecho(i = 1)
Economıa(i = 2)
Ad. & Emp.(i = 3)
Chico(j = 1)
1.81.51.1
0.91.20.6
1.51.20.9
Chica(j = 2)
0.10.20.2
0.90.60.7
0.90.60.6
Derecho(i = 1)
Economıa(i = 2)
Ad. & Emp.(i = 3)
Medias
Chico(j = 1)
1.47 0.90 1.20 1.19
Chica(j = 2)
0.17 0.73 0.70 0.53
Medias 0.82 0.82 0.95 0.86
Notaciones: Para i = 1, . . . , I, j = 1, . . . , J, k = 1, . . . , K (I = 3, J = 2,
K = 3) :
• yijk valor observado de Y del kesimo alumno del curso i y del sexo j, ;y121 = 0.1.
• yij• media observada de Y en la categorıa de los alumnos del curso i ydel sexo j; y12• = 0.17.
• yi•• media observada de Y en la categorıa de los alumnos del curso i ;y3•• = 0.95.
• y•j• media observada de Y en la categorıa de los alumnos del sexo j;y•2• = 0.53
• y••• media global de Y ; y••• = 0.86
9
1.2.2 El Modelo
Consideramos que cada dato observado yijk es igual al valor medio en sucategorıa (mij) mas una desviacion aleatoria εijk : Para i = 1, . . . , I, j =1, . . . , I y k = 1 . . . , K, tenemos
yijk = mij + εijk (Modelo 0)
Supondremos que las desviaciones εijk = yijk − mij son independientes ysiguen una distribucion normal N(0, σ2). Por tanto tenemos que las obser-vaciones yijk son independientes e yijk ∼ N(mij, σ
2).
Este modelo es util para describir los datos pero no permite contestar anuestro problema:
¿Como varia mij con i y j?
Varios modelos:Suponemos que
yijk = µ + αi + εijk (Modelo 1)
donde mij = µ + αi.Con el Modelo 1, estamos suponiendo que el factor Sexo no tiene un efectosobre Y (no explica sus variaciones).
Suponemos queyijk = µ + βj + εijk (Modelo 2)
donde mij = µ + βj.Con el Modelo 2, estamos suponiendo que el factor Curso no tiene un efectosobre Y .
Ahora, suponemos el modelo aditivo siguiente
yijk = µ + αi + βj + εijk (Modelo 3)
donde mij = µ + αi + βj.Con el Modelo 3, estamos suponiendo que ambos factores, Sexo y Curso,tienen un efecto sobre Y. Pero, suponiendo que el efecto de un factores constante en cualquier nivel del otro factor (El efecto del Sexo nocambia con el Curso y recıprocamente, el efecto del Curso no cambia con elSexo).
10
Modelo con interacciones: Suponemos que
yijk = µ + αi + βj + γij + εijk (Modelo 4)
donde mij = µ + αi + βj + γij.Los terminos de interaccion γij se denotan tambien γij = (αβ)ij .
1.2.3 Estimacion de los parametros del modelo
Hay IJ (IJ = 6 en el ejemplo) parametros mij que estimamos mediante elcriterio de mınimos cuadrados : Para cada i, j
mij valor de mij que mınimizaK∑
k=1
(yijk −mij)2 ,
Obtenemos mij = yij•.Los parametros αi, βj y γij verifican las restricciones:∑I
i=1 αi = 0.∑J
j=1 βj = 0.∑Ii=1 γij = 0, para cada j.
∑Jj=1 γij = 0, para cada i.
Por tanto, el numero de parametros linealmente independientes es:
Propiedad de los estimadores: Bajo las hipotesis del modelo, tenemosque
• mij sigue una normal N(mij,
σ2
K
).
• µ sigue una normal N(µ, σ2
n
).
• αi sigue una normal N(αi,
(I−1)σ2
n
).
• βj sigue una normal N(βj,
(J−1)σ2
n
)• γij sigue una normal N
(γij,
(I−1)(J−1)σ2
n
)Indicios de variabilidad Deducimos la distribucion de cada indicios devariabilidad
• V E (α) = JK∑I
i=1 α2i y bajo la hipotesis H0 : {αi = 0, ∀i}, V E (α)/ σ2
sigue un χ2(I − 1).
12
• V E (β) = IK∑J
j=1 β2
i y bajo la hipotesis H0 :{βj = 0, ∀j
}, V E (β)/ σ2
sigue un χ2(J − 1).
• V E (γ) = K∑I
i=1
∑Jj=1 γ2
ij y bajo la hipotesis H0 :{γij = 0, ∀i, j
},
V E (γ)/ σ2 sigue un χ2((I − 1) (J − 1)).
• V NE =∑
i,j,k e2ijk, y V NE/ σ2 sigue un χ2(n− IJ).
V T =∑i,j,k
(yijk − y•••)2
= V E(α) + V E(β) + V E(γ) + V NE
En el ejemplo, obtenemos que
V E (α) = 0.0711 gdlα = 2V E (β) = 1.934 gdlβ = 1V E (γ) = 1.0178 gdlγ = 2V NE = 0.720 gdlResidual = 12
Calculo de las varianzas Obtenemos las varianzas dividiendo cada indi-cio por el numero de grados de libertad asociado:
• s2α = V E (α) /(I − 1)
• s2β = V E (β) /(J − 1)
• s2γ = V E (γ) / [(I − 1)(J − 1)]
• s2R = V NE/(n− IJ).
1.2.4 Contraste sobre los efectos
Test de interaccion ¿Hay un riesgo de llegar a una conclusion falsa sobrela influencia de cada factor si existe interaccion!
Queremos contrastar las hipotesis
H0 : “No hay interacciones”{γij = 0, ∀i, j
} frente aH1 : “Hay interacciones”{
∃i, j, γij 6= 0}
13
Bajo H0, el estadıstico
F =s2γ
s2R
sigue una distribucion de Fisher F ((I − 1)(J − 1), n− IJ).
Por tanto, para un riesgo de tipo I α, rechazaremos H0 si F > f 1−α(I−1)(J−1),n−IJ .
• Si “la interaction no es significativa” (el test acepta H0) podemos con-trastar los efectos de cada factor.
• Si en cambio “la interaction es significativa” (el test rechaza H0) ten-emos que contentarnos con analizar las diferencias en cada categoria.
Test sobre cada factor Basamos el test del contraste de la hipotesis H0 :
{αi = 0, ∀i} frente a su alternativa, sobre el estadıstico F = s2α
s2R
que sigue
bajo H0, una Fisher F ((I−1), n−IJ). Para un riesgo I α, la regla de decisionsera entonces:
Rechazar H0 si F > f 1−α(I−1),n−IJ
El test del contraste de la hipotesis H0 :{βj = 0, ∀j
}frente a su alter-
nativa, esta basado sobre el estadıstico F =s2β
s2R
que sigue bajo H0, una Fisher
F ((J − 1), n− IJ). Para un riesgo I α, la regla de decision sera entonces:
Rechazar H0 si F > f 1−α(J−1),n−IJ
Tabla ADEVA (dos factores con interaccion): Resume de la descom-posicion de la variabilidad:
Fuentes deVariaciones
∑de cuad. gdl Varianzas F
Efecto α V E(α) I-1 s2α = V E(α)
I−1F = s2
α
s2R
Efecto β V E(β) J-1 s2β = V E(β)
J−1F =
s2β
s2R
Efecto deinteraccion
V E(γ) (I-1)(J-1) s2γ = V E(γ)
(I−1)(J−1)F =
s2γ
s2R
Internao residual
V NE n-IJ s2R = V NE
n−IJ
Total V T n-1 s2y = V T
n−1
14
p-valor: p = P(F > F |H0
)Cuanto mas pequeno sea p, menor sera la credibilidad de H0.
Comentario: gdlR = n−(numero total de parametros).
Tabla ADEVA (dos factores sin interaccion): Si aceptamos la hipotesisH0 : “No hay interacciones”, podemos volver a estimar los parametros uti-lizando el modelo (3). Se obtiene la tabla ADEVA:
Fuentes deVariaciones
∑de cuad. gdl Varianzas F
Efecto α V E(α) I-1 s2α = V E(α)
I−1F = s2
α
s2R
Efecto β V E(β) J-1 s2β = V E(β)
J−1F =
s2β
s2R
Internao residual
V NE n-(I+J)+1 s2R = V NE
n-(I+J)+1
Total V T n-1 s2y = V T
n−1
Aquı gdlR = n− (I + J) + 1. Por tanto, los tests para contrastar los efectosde cada factor son:
• Rechazamos H0 : {αi = 0, ∀i}si F = s2
α
s2R
> f 1−α(I−1),n−(I+J)+1
• Rechazamos H0 :{βj = 0, ∀j
}si F =
s2β
s2R
> f 1−α(J−1),n−(I+J)+1
1.2.5 Intervalos de confianza (I.C.)
IC para la varianza residual Utilizamos que
V NE
σ2∼ χ2
(gdlR).
donde por ejemplo gdlR = n − IJ en el modelo 4. Podemos hallar aα y bα
tal que
P(χ2
(gdlR) ≤ aα
)= P
(χ2
(gdlR) ≥ bα
)= α/2.
15
El I.C. con nivel α para σ2 sera entonces:
VNE
bα
≥ σ2 ≥ VNE
aα
I.C. para las medias Utilizamos que
T =yij• −mij√
s2R /K
∼ t (gdlR)
Utilizando el cuantil t(gdlR)α/2 de la distribucion de Student: P
(T ≥ t
(gdlR)α/2
)=
α/2, obtenemos el I.C. con nivel α para la media mij :
yij• + t(gdlR)α/2
√s2
R /K ≥ mij ≥ yij• − t(gdlR)α/2
√s2
R /K
1.2.6 Contraste multiples: metodo de Bonferroni
Suponemos que I = 3 y queremos hacer los tres contrastes siguiente sobrelas medias mi2 (cantidad media de cerveza bebida por las chicas del cursoi) :
H10 : m12 = m22 frente a H1
1 : m12 6= m22
H20 : m12 = m32 frente a H2
1 : m12 6= m32
H30 : m22 = m32 frente a H3
1 : m22 6= m32
Para cada uno de esos contrastes, construimos un test con nivel α = 5% (verseccion “Analisis de las diferencias entre medias”).
Para r = 1, 2, 3, Sea Cr el suceso “Rechazar Hr0 cuando H0 es cierto”, por
construccion del test, tenemos:
P (Cr) = α
Por tanto, la probabilidad de que se acepte conjuntamente la tres hipotesiscuando H0 es cierto sera (caso independiente):
P(C1 ∩ C2 ∩ C3
)= P (C1)P (C2)P (C3)
= (1− α)3 = 0.953 ' ¡0.85!
16
Metodo de Bonferoni: Denotamos C el suceso “Rechazar al menos unahipotesis nula Hr
0 cuando H0 es cierto”. Entonces C sera la union:
C = C1 ∪ C2 ∪ C3
Puesto que las regiones de rechazo Cr no son necesariamente incompati-bles, tenemos que
αT = P (C) = P (C1 ∪ C2 ∪ C3)
≤ P (C1) + P (C2) + P (C3) = 3α
Por tanto, si se pretende garantizar un riesgo αT = 5%, tendremos que fijarα tal que α = αT /3.
De manera general, si hacemos un contraste multiple con p contrastestendremos que elegir
α =αT
p
Comentario: ¡Este metodo es muy conservador! : α puede ser muy pequeno.
1.3 Modelos en Bloques
Objetivo: Reducir la varianza residual para mejorar la “visibilidad” de losefectos de los factores de interes, introduciendo un factor cuyo efecto sobrela variable Y no es de interes. Llamamos este tipo de factor: variable bloque.
Comentarios: En el modelo, se supone que no hay interaccion entre lasvariables bloques y los factores.de interes
Ejemplo: Supongamos que el importe de la factura de telefono mensual(en Euros) utilizando dos operadoras distintas (O1 y O2). Disponemos delos datos siguientes:
Para reducir la varianza residual, introducimos la variable bloque ”taza diariade llamadas” con 3 niveles: baja,media,alta. Obtenemos la tabla de datossiguiente donde las diferencias entre operadoras son mas visibles:
En los modelos anteriores con uno o dos factores, los efectos fueron prefijados.Si queremos alcanzar un grado de generalidad superior para un cierto factortenemos que suponer que sus efectos son aleatorios. Ası en el estudio sobre lacantidad de cerveza consumida por los alumnos, podemos considerar que loscursos han sido elegidos al azar. Con este tipo de diseno podremos extendernuestra interpretacion a cualquier curso.
La formulacion del modelo es identica, pero en el modelo de efectos fijos,estimamos medias, y en el de efectos aleatorios, varianzas. En el primero,los efectos αi, βj, γij ..., etc representan la respuesta media, y son parametrosfijos a estimar; en el de efectos aleatorios, son variables aleatorias normalesindependientes de media cero y varianza σ2
α, σ2β, σ2
γ, siendo estas varianzas elparametro a estimar.
18
Efectos fijos Efectos aleatorios
Modeloyij = µ + αi + εij∑
αi = 0yij = µ + αi + εij
αi ∼ N (0, σ2α)
Los efectosαi son
parametrosdesconocidos
variablesaleatorias
Los efectosinfluyen
en la respuestamedia
en la varianza
Se pretende estimar los αi Estimar σ2α
Los niveles αise fijanarbitrariamente
se selecionanal azar
La hipotesisH0 es
αi = 0 σ2α = 0
La descomposicion de la variabilidad en fuentes de variaciones y la tablaADEVA se realiza igual en ambos tipos de modelos y, si no existe interaccion,los tests de que un factor no influye son identicos..
Proporcion de supervivientes de la catastrofe del Titanic
Preguntas:
23
1. Contrastar el efecto del factor Sexo y del factor Clase (nivel α = 10%),suponiendo que no hay interaccion
2. Dar un intervalo de confianza del 95% para la varianza residual.
Soluciones:
1. El modelo es para i = 1, . . . , 3, j = 1, . . . , 2
yij = mij + εij
= µ + αi + βj + εij
donde α es el factor clase y β el factor sexo. Obtenemos la tablaADEVA
Fuentes deVariaciones
∑de cuad. gdl. Varianzas F
Factor α 0.1092 2 s2α = 0.0546 F = 1.964
Factor β 0.5046 1 s2β = 0.5046 F = 18.151
Residual 0.0556 2 s2R = 0.0278
Total 0.6694 5
tenemos que f 90%2,2 = 9 y f 90%
1,2 = 8.526 por tanto aceptamos H0 : αi = 0y rechazamos H0 : βj = 0.
2. Puesto que χ22,0.025 = 7.378 y χ2
2,0.975 = 0.051 deducimos que el intervalode confianza del 95% para σ2 es [0.0075, 1.09] .
Modelo con replicacion (K > 1)
Africa oriental Europa Asia Central
Hombres464544
747575
465958
Mujeres474848
818183
445957
Esperanza de vida
24
Preguntas:
1. Contrastar la interaccion entre el factor sexo y continente (nivel α =10%).
2. Dar un intervalo de confianza del 95% para la varianza residual.
Solucion
1. El modelo es para i = 1, . . . , 3, j = 1, . . . , 2
yij = mij + εij
= µ + αi + βj + γij + εij
donde α es el factor continente, β el factor sexo, y γ el factor de inter-accion
(a) Estimacion
mij Africa oriental Europa Asia CentralHombres 45 74.67 54.33 58Mujeres 47.66 81.67 53.33 60.89
46.33 53.83 78.17 59.44
(b) Obtenemos la tabla ADEVA
Fuentes deVariaciones
∑de cuad. gdl. Varianzas F
Factor α 3323.44 2 s2α = 1661.72 F = 81.95
Factor β 37.56 1 s2β = 37.56 F = 1.85
Factor γ 48.11 2 s2γ = 24.05 F = 1.19
Residual 243.33 12 s2R = 20.29
Total 3642.44 17
tenemos que f 95%2,12 = 3.88 y f 95%
1,12 = 4.74 por tanto aceptamosH0 : γij = 0: el factor de interaccion no es significativo. Luego,aceptamos H0 : βj = 0 y rechazamos H0 : αi = 0, o sea, elfactor sexo no tiene un efecto significativo y en cambio, el factorcontinente si.