-
ESTADISTICA ITema 5: Contraste de hipotesis
I Planteamiento del problemaI Conceptos basicos: hipotesis nula
y alternativa, tipos de errores,
nivel de significacion, region crtica o de rechazo, tamano del
test,potencia
I Contrastes para la media de una distribucionI Consistencia de
tests. Tests insesgados y UMPI p-valorI Contrastes para dos
muestras. Distribucion F de Fisher-SnedecorI Lema de
Neyman-Pearson. Tests optimosI Construccion de tests: test de razon
de verosimilitudes, test
bayesiano.
Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste
de hipotesis 1
-
Planteamiento del problema. Conceptos basicos
El objetivo de la teora de contraste de hipotesis es elegir
entre dosposibilidades excluyentes (hipotesis nula e hipotesis
alternativa)relativas al valor de un parametro poblacional, a
partir de lainformacion proporcionada por los datos muestrales.
Sea X1, . . . ,Xn una muestra aleatoria de una v.a. X con
funcionde distribucion F, donde .Objetivo: Dada una particion del
espacio parametrico = 0 1, deseamos decidir, en base a la muestra
obtenida, si 0 o si 1. Queremos contrastar
H0 : 0 (hipotesis nula)H1 : 1 (hipotesis alternativa)
Un test para contrastar estas dos hipotesis consiste en
proporcionaruna regla de decision que, a cada posible observacion
de la muestra(x1, . . . , xn), le asigne una decision: aceptar o
rechazar H0.
Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste
de hipotesis 2
-
Los contrastes habituales (no aleatorizados) se definen
medianteuna region crtica o region de rechazo R Rn, de tal manera
que,cuando (x1, . . . , xn) R, se rechaza la hipotesis nula.
Espacio muestral
(x1,...,xn)
(x1,...,xn)
Regin crticao de rechazoR
Regin deaceptacin A
Rechazo H0
Acepto H0
TEST
Decisin
Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste
de hipotesis 3
-
Es importante destacar que la metodologa de contraste
dehipotesis no demuestra la validez de la hipotesis que se aceptaen
cada caso (en el sentido en el que se demuestra algo medianteun
metodo deductivo, por ejemplo).
La manera correcta de interpretar los resultados es decir que
losdatos disponibles proporcionan (o no proporcionan)
evidenciaestadstica suficiente en contra de la hipotesis nula. En
todo caso,la conclusion depende de informacion incompleta y
aleatoria,procedente de una o varias muestras, y siempre existe la
posibilidadde cometer un error aceptando una hipotesis
equivocada.
Los procedimientos que se utilizan habitualmente se
suelendenominar contrastes o tests de hipotesis.
Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste
de hipotesis 4
-
Posibles errores de un test:
I Error de tipo I: Rechazar H0 cuando H0 es cierta.
I Error de tipo II: Aceptar H0 cuando H0 es falsa.
La funcion de potencia de un test con region de rechazo R
paracontrastar H0 : 0 frente a H1 : 1 es la funcion
n : [0, 1] 7 n() = P{(X1, . . . ,Xn) R}
Lo que nos gustara:
0 1
Potencia = 1Potencia = 1
Potencia = 0
Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste
de hipotesis 5
-
Lo que en realidad se suele hacer (teora de Neyman-Pearson):
1. Acotar la maxima probabilidad de error de tipo I.
Se fija un nivel de significacion (0, 1). Tpicamente = 0, 05. Se
define el tamano de un test como la maxima probabilidad
de error de tipo I: max0
P(R) = max0
n().
Se busca una region de rechazo R tal que max0
P(R) .2. Minimizar la probabilidad de error de tipo II. Se
intenta
buscar una region de rechazo R que maximice la funcion
depotencia cuando 1.
Las hipotesis H0 y H1 no son simetricas.
Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste
de hipotesis 6
-
Como vemos, los test de hipotesis estan disenados para controlar
laprobabilidad maxima de rechazar H0 cuando es cierta.
Enconsecuencia, suelen ser conservadores con la hipotesis nula:hace
falta mucha evidencia muestral para rechazar H0.
Observemos que es posible que, con los mismos datos, H0
serechace para un nivel de significacion = 0.05 y se acepte para =
0.01.
En una primera aproximacion, los problemas de contraste
dehipotesis pueden clasificarse en problemas de una muestra
(cuandohay una sola poblacion de interes) y problemas de dos
muestras(cuando se quiere comparar dos poblaciones y se dispone de
unamuestra de cada una de ellas). Presentaremos las ideas basicas
enel caso de los problemas de una muestra pero pueden extendersede
modo analogo a los de dos muestras.
Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste
de hipotesis 7
-
Un ejemplo ilustrativo y sus consecuencias
Ejemplo: Se analiza un envo de botellas de aceite envasado conun
mecanismo del que se afirma que, en media, rellena las botellascon
100 cl. de aceite. Examinada una muestra de 5 botellas seobtiene
que el promedio es 95 cl. y la cuasivarianza es 1.1.Suponemos que
la v.a. X = contenido de aceite (en cl.) en unabotella sigue una
distribucion N(, ). Hay suficiente evidenciaemprica para afirmar
que el contenido medio de las botellas no es100 cl.?Queremos
contrastar
H0 : = 100, frente a H1 : 6= 100.Otra posibilidad sera
preguntarse si existe evidencia empricasuficiente para afirmar que
el consumidor recibe, en promedio,menos cantidad de la que indica
la etiqueta. En ese caso, elplanteamiento correcto sera
contrastar
H0 : 100, frente a H1 : < 100.Estadstica I (Mat/DG).
Profesora: Amparo Ballo Tema 5: Contraste de hipotesis 8
-
Ejemplo (cont.): Tenemos, por tanto, un problema del tipo:
contrastar H0 : = 0 frente a H1 : 6= 0(siendo 0 un valor
prefijado) a partir de una muestra X1, . . . ,Xnextrada de N(,
).
Para ello prefijamos el nivel de significacion del test (0, 1)
(porejemplo, = 0.05) y observamos que, si H0 fuera cierta,
X 0s/
n tn1. (1)
Por otra parte, esta claro que deberamos sospechar que H0 es
falsa(y, por tanto, H1 es cierta) cuando x resulte estar
suficientementealejada de 0. El resultado (1) nos ayuda a decidir,
de un modoracional, que es lo que significa suficientemente
alejada.
Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste
de hipotesis 9
-
Ejemplo (cont.): En efecto, dada una muestra x1, . . . , xn,
parecemuy natural decidir que H0 es falsa cuando tengamos x
0s/n
> tn1;/2. (2)ya que, en este caso, tenemos una muestra que
sera muy rara sirealmente H0 fuera cierta.Observese que, de todos
modos, hay una probabilidad , prefijada,de cometer un error de tipo
I (rechazar H0 siendo cierta).Analogamente, si el problema hubiera
sido contrastar
H0 : 0 frente a H1 : < 0,
un criterio razonable para rechazar H0 con un nivel de
significacion sera
x 0s/
n< tn1;. (3)
Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste
de hipotesis 10
-
Ejemplo (cont.): En el ejemplo del envasado de aceite x = 95,s2
= 1.1, n = 5. Por tanto, x 0s/n
= 10.66y como 10.66 > t4;0.025 = 2.776445, H0 : = 100 se
rechaza alnivel de significacion = 0.05 y, dado que10.66 >
t4;0.005 = 4.604095, tambien se rechaza al nivel 0.01.
Sin embargo, supongamos que hubieramos obtenido x = 98,s2 = 1.1,
n = 5. Entonces x 0s/n
= 4.264014y la hipotesis H0 se rechazara al nivel = 0.05 pero NO
serechazara al nivel 0.01.
Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste
de hipotesis 11
-
Ejemplo (cont.): En el ejemplo de las botellas, supongamos
quequeremos contrastar
H0 : 100 frente a H1 : < 100.
Entonces el criterio para rechazar H0 con un nivel de
significacion sera
x 100s/
5< t4;.
Supongamos que hubieramos obtenido x = 98. Entoncesx 100
s/
5= 4.2640. Como t4;0.01 = 3.7469, la hipotesis nula
H0 : 100 se rechaza al nivel 0.01 (y tambien por supuesto,
alnivel 0.05, ya que t4;0.05 = 2.1318).
Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste
de hipotesis 12
-
Algunas consecuencias y observaciones:
El anterior ejemplo es un solo un caso particular de contraste
dehipotesis, pero nos permite extraer algunas consecuencias y
daralgunas definiciones generales sobre la metodologa del
contrastede hipotesis.
I Asimetra de las hipotesis: H0 se acepta a menos que se
hayaobtenido suficiente evidencia estadstica en contra de ella.
Poresta razon, cuando H0 se acepta no debe pensarse que se
hademostrado su validez. H0 representa la hipotesis que
estamosdispuestos a aceptar a menos que se obtengan fuertes
indiciosen contra.
I Errores de tipo I y II: En todo caso siempre hay
unaprobabilidad positiva de cometer uno de los dos posibles
errores:rechazar H0 cuando es cierta (error de tipo I) o aceptar
H0cuando es falsa (error de tipo II).
Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste
de hipotesis 13
-
I El nivel de significacion: Los tests usuales estan construidos
demodo que la maxima probabilidad de cometer el error de tipo Iesta
acotada por un valor prefijado , el nivel de significacion(no
confundir con el nivel de confianza de los intervalos).
I La decision de rechazar o aceptar H0 depende del nivel
designificacion elegido. Cuanto mas pequeno es masconservador se
hace el test a favor de H0, es decir, que paraaceptar H1 cuando es
muy pequeno, debemos tener muchaevidencia estadstica.
I Cuando se toma una decision (aceptar o rechazar H0)
debeindicarse siempre el nivel de significacion del test que se
hautilizado.
I Cuando se acepta H0 no debe pensarse que se ha demostradoH0
sino que no se ha encontrado suficiente evidencia emprica(al nivel
prefijado ) en contra de H0.
Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste
de hipotesis 14
-
I Cuando se acepta H1 debe recordarse tambien que
lainterpretacion correcta es que los datos obtenidosproporcionan
suficiente evidencia estadstica al nivel paraaceptar H1. Una
muestra diferente (o un nivel de significacionmas bajo) podran
haber llevado a conclusiones distintas.
I Dualidad con los intervalos de confianza: en algunos casos
dehipotesis nula simple (i.e. del tipo H0 : = 0) el test
usualrechaza H0 (al nivel de significacion ) si y solo si el
intervalode nivel de confianza 1 no contiene al valor 0.Ejemplo: Si
X N(, ) la region de rechazo
R =
{(x1, . . . , xn) : |x 0| tn1;/2
sn
}del contraste
H0 : = 0
H1 : 6= 0equivale a
R = {(x1, . . . , xn) : 0 / IC1()} .Estadstica I (Mat/DG).
Profesora: Amparo Ballo Tema 5: Contraste de hipotesis 15
-
Contrastes para la media de una distribucion
En cada caso se rechaza H0 cuando (x1, . . . , xn) R.
Distribucion normal con varianza conocida: Sea X1, . . . ,Xnuna
muestra aleatoria de X N(, ) con conocido.
H0 : = 0 R =
{(x1, . . . , xn) : |x 0| z/2
n
}H0 : 0 R =
{(x1, . . . , xn) : x 0 z
n
}H0 : 0 R =
{(x1, . . . , xn) : x 0 z1
n
}donde z es tal que (z) = 1 siendo la funcion dedistribucion de
la N(0, 1).
Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste
de hipotesis 16
-
Distribucion normal con varianza desconocida: SeaX1, . . . ,Xn
una muestra aleatoria de X N(, ) con desconocido.
H0 : = 0 R =
{(x1, . . . , xn) : |x 0| tn1;/2
sn
}H0 : 0 R =
{(x1, . . . , xn) : x 0 tn1; s
n
}H0 : 0 R =
{(x1, . . . , xn) : x 0 tn1;1 s
n
}
Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste
de hipotesis 17
-
Tests de nivel aproximado (muestras grandes) para lamedia de
cualquier distribucion: Sea X1, . . . ,Xn una muestraaleatoria de X
con E(X ) = z/2}
H0 : 0, frente a H1 : > 0
R =
{(x1, . . . , xn) :
x 0s/
n> z
}H0 : 0, frente a H1 : < 0
R =
{(x1, . . . , xn) :
x 0s/
n< z
}
Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste
de hipotesis 18
-
Tests de nivel aproximado (muestras grandes) para elparametro p
en una Bernoulli: Sea X1, . . . ,Xn una muestraaleatoria de X
Bernoulli(p).
H0 : p = p0, frente a H1 : p 6= p0.
El criterio de rechazo es (x1, . . . , xn) R, siendo
R =
(x1, . . . , xn) : x p0p0(1p0)
n
> z/2
y analogamente para los tests con hipotesis H1 unilaterales.
En el formulario que se puede descargar de la pagina webhay una
lista de las regiones crticas correspondientes alos contrastes de
uso mas frecuente.
Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste
de hipotesis 19
-
Contrastes para la varianza de una normal
Sea X1, . . . ,Xn una muestra aleatoria de X N(, ) con
desconocido.
H0 : = 0 R =
{(n 1)s2
20/ (2n1;1/2 , 2n1;/2)
}= {20 / IC1(2)}
H0 : 0 R ={
(n 1)s220
2n1;}
H0 : 0 R ={
(n 1)s220
2n1;1}
Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste
de hipotesis 20
-
El concepto de p-valor
Dado un test, definido para todos los niveles de
significacionposibles, se define el p-valor, para unos datos
prefijados, como elnfimo de los valores para los cuales se rechaza
la hipotesis nulaa un nivel de significacion .
P(x1, . . . , xn) = inf{ : H0 es rechazada al nivel }.
Cuanto mas pequeno es el p-valor, mas evidencia
estadsticaaportan los datos a favor de H1.
El p-valor se puede interpretar como la probabilidad de obtener
unvalor al menos tan raro como el que se ha obtenido cuando H0es
cierta.
Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste
de hipotesis 21
-
Ejemplo: Los lagartos del desierto se esconden del calor en
veranopara evitar que su temperatura corporal interna llegue al
nivel letalde 45oC. Se ha tomado una muestra para estudiar el
tiempo X (enminutos) requerido para que la temperatura de un
lagarto alcancelos 45oC, partiendo de su temperatura normal
mientras estaban enla sombra. Se han obtenido los siguientes
datos:
10,1 12,5 12,2 10,2 12,8 12,111,2 11,4 10,7 14,9 13,9 13,3
Suponiendo que X sigue una distribucion N(, ) y, en base aestos
datos, puede concluirse que el tiempo medio requerido paraalcanzar
la temperatura letal es menor que 13 minutos?
Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste
de hipotesis 22
-
Contrastes para dos muestras
Caso de muestras independientes:
Se tienen dos muestras X1, . . . ,Xn1 e Y1, . . . ,Yn2 de dos
v.a. X eY . Ambas muestras se suponen independientes entre s. Se
deseacontrastar hipotesis del tipo
H0 : 1 = 2
H0 : 1 2H0 : 1 = 2
En los ejercicios propuestos se pueden encontrar varios
ejemplos.
Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste
de hipotesis 23
-
Uno de los tests mas usuales es el de igualdad de medias para
dospoblaciones normales homocedasticas, es decir, con 1 = 2:Se
puede probar que, bajo H0 : 1 = 2,
X Ysp
1n1
+ 1n2
tn1+n22
y, por tanto, una region crtica al nivel es
R =
{|x y | > tn1+n22;/2 sp
1
n1+
1
n2
}siendo
s2p =(n1 1)s21 + (n2 1)s22
n1 + n2 2la varianza combinada (pooled variance).
Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste
de hipotesis 24
-
Para contrastar la hipotesis de homocedasticidad (igualdad
devarianzas) de dos poblaciones normales presentamos una
nuevadistribucion auxiliar.
Sean Q1 y Q2 v.a. independientes con distribuciones 2n1 y
2n2 ,
respectivamente. La distribucion deQ1/n1Q2/n2
se denomina F de
Fisher-Snedecor con n1 y n2 grados de libertad, Fn1,n2 .
0 1 2 3 4 5
0.00.5
1.01.5
2.0
range(x)
c(0, 2)
n1=1, n2=1
n1=2, n2=1
n1=5, n2=2
n1=100, n2=1
n1=100, n2=100
Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste
de hipotesis 25
-
Si s21 , s22 son la cuasi-varianzas de dos muestras
independientes de
tamano n1 y n2 extradas, respectivamente, de dos poblacionesN(1,
1) y N(2, 2), se tiene
(n1 1)s2121
2n11,(n2 1)s22
22 2n21,
Por tanto, bajo H0 : 1 = 2,
s21s22 Fn11,n21.
De este resultado se derivan los tests para comparar 1 y 2.
Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste
de hipotesis 26
-
H0 : 1 = 2 R =
{s21s22
/ (Fn11;n21;1/2,Fn11;n21;/2)}
=
{1 / IC1
(2122
)}H0 : 1 2 R =
{s21s22> Fn11;n21;
}H0 : 1 2 R =
{s21s22< Fn11;n21;1
}
Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste
de hipotesis 27
-
Caso de muestras emparejadas:
Surge en aquellas situaciones con n1 = n2 en que Xi e Yi no
sonindependientes (porque corresponden, por ejemplo, a
medicionessobre el mismo individuo antes y despues de un
tratamiento).
Se reducen a problemas de una muestra para la muestra
dediferencias Di = Xi Yi .Puede verse un ejemplo en los problemas
de la Relacion 5.
Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste
de hipotesis 28
-
Consistencia de tests. Tests insesgados y UMP
Se dice que una sucesion de tests con un nivel prefijado
esconsistente cuando
limnn() = 1, 1 = \0.
Se dice que un test es insesgado cuando
n() 0 y n() 1.
Se dice que un test con funcion de potencia n es
uniformementemas potente (UMP) dentro de una clase Bn, de tests de
nivel basados en muestras de tamano n cuando
n() n(), 1siendo n la funcion de potencia de cualquier otro test
de la claseBn,.
Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste
de hipotesis 29
-
El lema de Neyman-Pearson
Se considera el problema de hipotesis simple y alternativa
simple
H0 : = 0 frente a H1 : = 1.
Denotemos fn(x1, . . . , xn; ) =n
i=1 f (xi ; ).Dado (0, 1), supongamos que la region
R ={
(x1, . . . , xn) :fn(x1, . . . , xn; 1)
fn(x1, . . . , xn; 0)> k
}verifica P0(R) = . Entonces
P1(R) P1(R),
siendo R la region crtica de cualquier otro test tal que P0(R)
.En otras palabras, R es el test optimo de nivel para el
problemaconsiderado.
Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste
de hipotesis 30
-
Demostracion del lema de Neyman-Pearson: Denotemosx = (x1, . . .
, xn)
P1(R) P1(R) =
RRc
fn(x; 1)dxRcR
fn(x; 1)dx,
pero, por definicion de R,RRc
fn(x; 1)dx kRRc
fn(x; 0)dx
y tambien RcR
fn(x; 1)dx kRcR
fn(x; 0)dx.
Por lo tanto
P1(R) P1(R) k
[RRc
fn(x; 0)dxRcR
f (x; 0)dx
]= k
[R
fn(x; 0)dxR
fn(x; 0)dx
]= k [P0(R
) P0(R)] 0. Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema
5: Contraste de hipotesis 31
-
Familias parametricas con cociente de verosimilitudesmonotono y
tests optimos
I Como construir tests optimos en problemas que no sean de
hipotesissimple y alternativa simple?
I Consideremos el caso en que el modelo es de la forma f (; ),
siendo , donde R es un intervalo.
I Sea fn(x1, . . . , xn; ) =n
i=1 f (xi ; ).
I Supongamos que queremos contrastar H0 : 0 frente a H1 : >
0.
Definicion.- Se dice que f (|) es una familia parametrica
concociente de verosimilitudes monotono (CVM) si existe
unestadstico Tn(x1, . . . , xn) tal que, para todo 1, 2, con 1 <
2, larazon de verosimilitudes
fn(x1, . . . , xn; 2)
fn(x1, . . . , xn; 1)
es una funcion monotona no decreciente de Tn(x1, . . . ,
xn).
Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste
de hipotesis 32
-
Como consecuencia directa del Lema de Neyman-Pearson y de
laanterior definicion se tiene
Teorema.- Supongamos que f (; ) cumple la propiedad CVM yque k
es tal que
P0{Tn > k} = .Supongamos ademas que P{Tn = c} = 0, para todo
y c.Entonces, R = {(x1, . . . , xn) : Tn(x1, . . . , xn) > k} es
la regioncrtica de un test optimo (uniformemente mas potente) de
nivel para contrastar H0 : 0 frente a H1 : > 0.
Un resultado analogo es valido para H0 : 0 frente aH1 : < 0
aunque en este caso la propiedad CVM debe cumplirsecambiando no
decreciente por no creciente.
Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste
de hipotesis 33
-
Ejemplo: Sea f (; ) una uniforme en (0, ). La propiedad CVM
secumple con Tn(x1, . . . , xn) = max{x1, . . . , xn}. Por tanto,
el testoptimo de nivel para H0 : 0 frente a H1 : > 0 es
R = {(x1, . . . , xn) : max{x1, . . . , xn} > k}, donde
1(
k0
)n=
es decir, k = exp(
1n log(1 ) + log(0)
).
Ejemplo: Si f (x ; ) = ex1[0,)(x), la propiedad CVM secumple con
Tn(x1, . . . , xn) = 1/
ni=1 xi .
Por tanto, el test optimo de nivel para H0 : 0 frente aH1 : >
0 es
R = {(x1, . . . , xn) : 1ni=1 xi
> k} donde P0{n
i=1
Xi 2k1;,
Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste
de hipotesis 37
-
Aqu el numerador de n es
n!
O1! . . .Ok !pO110 . . . p
Okk0 ,
siendo Oj = #{i : xi = aj} las frecuencias observadas de los
distintosvalores de la variable [notese que, bajo H0, (O1, . . .
,Ok) tienedistribucion multinomial M(n; p10, . . . , pk0)]. El
denominador de n es
n!
O1! . . .Ok !
(O1n
)O1. . .
(Okn
)Ok.
Sustituyendo en n es inmediato ver que el estadstico de
contraste sepuede expresar en la forma
2 log n = 2k
i=1
Oi log
(Oiei
),
donde ei = npi0, i = 1, . . . , k son las frecuencias esperadas
(bajo H0)
de los distintos valores de la variable en una muestra de tamano
n.
Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste
de hipotesis 38
-
Un ejemplo clasico: el experimento de Mendel
En el famoso experimento de Mendel secruzaron plantas de
guisantes con fenotiporugoso-amarillo con otras de fenotipo
liso-verde. En la segunda generacion se podanobservar cuatro
fenotipos (liso-amarillo,rugoso-amarillo, liso-verde,
rugoso-verde)cuyas respectivas probabilidades, segun lateora de la
herencia mendeliana, deban ser
p10 =9
16, p20 =
3
16, p30 =
3
16, p40 =
1
16.
Observados n = 556 guisantes en la segundageneracion del
experimento se obtuvieron lossiguientes numeros de guisantes con
estosfenotipos:
O1 = 315,O2 = 101,O3 = 108,O4 = 32.
Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste
de hipotesis 39
-
Proporcionan estos resultados alguna evidencia en contra de
lateora mendeliana?
Aplicamos el test para contrastar H0 : p1 =9
16 , . . . , p4 =1
16 :
e1 = 556 916
= 312.75, e2 = e3 = 556 316
= 104.25, e4 = 556 116
= 34.75
En definitiva, el test de cociente de verosimilitudes compara
las Oicon las ei y rechaza la hipotesis nula cuando hay
demasiadasdiferencias entre ellas. Esto se hace formalmente
mediante elestadstico
2 log n = 2k
i=1
Oi log
(Oiei
)= 0.4754
El p-valor (calculado a partir de la distribucion 23) es 0.9281
loque, por supuesto, no indica ninguna evidencia estadstica
encontra de H0.
Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste
de hipotesis 40
-
Hay una controversia clasica en la historia de la ciencia en
elsentido de que los resultados de Mendel eran demasiado buenos,es
decir, haba demasiada concordancia entre las Oi y las ei
(porejemplo, R.A. Fisher era de esta opinion; ver su artculo de
1936,Has Mendels work been rediscovered?, en The Annals
ofScience).
Se ha sugerido que este supuesto exceso de concordancia
podadeberse a un sesgo de repeticion (confirmation bias)
producidopor la repeticion de los resultados hasta que las Oi
concordasenfuertemente con las ei . Tambien se ha conjeturado que
algunayudante de Mendel pudo actuar con exceso de celomanipulando
los resultados. En todo caso, las ideas basicas deMendel eran
acertadas y han tenido una influencia decisiva.
Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste
de hipotesis 41
-
Construccion de tests. Test bayesianos
Se desea contrastar
H0 : 0 frente a H1 : \0.
Como siempre, la informacion procede de una muestra x1, . . . ,
xn.
La metodologa bayesiana supone que la densidad que ha
generadolos datos es f (|) y que el parametro puede considerarse
comouna v.a. con distribucion a priori pi(). A partir de aqu se
calculanla distribucion a posteriori pi(|x1, . . . , xn) dada
por
pi(|x1, . . . , xn) = fn(x1, . . . , xn|)pi() fn(x1, . . . ,
xn|)pi()d
,
donde fn(x1, . . . , xn|) =n
i=1 f (xi ; ).
Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste
de hipotesis 42
-
El elemento fundamental en la inferencia bayesiana es siempre
ladistribucion a posteriori. A partir de ella se pueden calcular
lasprobabilidades a posteriori de ambas hipotesis
P{ 0|x1, . . . , xn} = pi(H0|x1, . . . , xn) =
0
pi(|x1, . . . , xn)d,P{ 1|x1, . . . , xn} = pi(H1|x1, . . . ,
xn) = 1 pi(H0|x1, . . . , xn),
y decidir dependiendo de sus valores. Tpicamente se optara porH1
cuando
pi(H1|x1, . . . , xn) ,donde (0, 1) es un valor que se fija
dependiendo de la gravedadque se atribuya al error de tipo I
(rechazar H0 cuando es cierta).
Observemos que la metodologa bayesiana de contraste de
hipotesisdepende fuertemente de la eleccion de la distribucion a
priori pi.
Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste
de hipotesis 43