Top Banner
GoBack
54

GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

Sep 26, 2018

Download

Documents

truongnga
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

GoBack

Page 2: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

1 / 40

Descripcion de tablas de contingencia

Guillermo Ayala GallegoUniversidad de Valencia

15 de octubre de 2008

Page 3: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

Un ejemplo

Page 4: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

Probabilidad y tablas de

contingencia

Probabilidad ytablas decontingencia

Distribucionconjunta y tabla decontingencia

DistribucioncondicionalIndependencia yhomogeneidad

Tablas decontingencia

Tablas decontingencia

Sensibilidad yespecificidad

Tipo de muestreo

Tipo de muestreo:verosimilitud

Un ejemplo

Comparacion de dosproporciones

Asociacion parcialen tablas 2× 2

estratificadas

Tablas I × J

2 / 40

Page 5: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

Distribucion conjunta y tabla de contingencia

3 / 40

X e Y dos variables categoricas con I y J categorıas.Un sujeto puede venir clasificado en una de I × J categorıas.Dada una muestra podemos construir la siguiente tabla dondeconsideramos X= toma aspirina o placebo (I = 2) e Y = sufreataque cardıaco o no (J = 2).

Ataque fatal Ataque no fatal No ataquePlacebo 18 171 10845Aspirina 5 99 10933

Esta tabla recibe el nombre de tabla de contingencia o tabla de

clasificacion cruzada.

Page 6: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

Probabilidad ytablas decontingencia

Distribucionconjunta y tabla decontingencia

DistribucioncondicionalIndependencia yhomogeneidad

Tablas decontingencia

Tablas decontingencia

Sensibilidad yespecificidad

Tipo de muestreo

Tipo de muestreo:verosimilitud

Un ejemplo

Comparacion de dosproporciones

Asociacion parcialen tablas 2× 2

estratificadas

Tablas I × J

4 / 40

Su distribucion conjunta viene dada por

πij = P (X = i, Y = j),

con i = 1, . . . , I y j = 1, . . . , J .Las distribuciones marginales son

πi+ = P (X = i) =J

j=1

P (X = i, Y = j) =J

j=1

πij

π+j = P (Y = j) =I

i=1

P (X = i, Y = j) =I

i=1

πij

Page 7: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

Distribucion condicional

Probabilidad ytablas decontingencia

Distribucionconjunta y tabla decontingencia

DistribucioncondicionalIndependencia yhomogeneidad

Tablas decontingencia

Tablas decontingencia

Sensibilidad yespecificidad

Tipo de muestreo

Tipo de muestreo:verosimilitud

Un ejemplo

Comparacion de dosproporciones

Asociacion parcialen tablas 2× 2

estratificadas

Tablas I × J

5 / 40

Habitualmente una variable, por ejemplo Y , esuna variable respuesta y la otra, X es explicativa opredictora.En esta situacion no tiene sentido hablar dedistribucion conjunta.Distribucion condicionada de Y a X

P (Y = j|X = i) = πj|i =πij

πi+

Page 8: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

Independencia y homogeneidad

Probabilidad ytablas decontingencia

Distribucionconjunta y tabla decontingencia

DistribucioncondicionalIndependencia yhomogeneidad

Tablas decontingencia

Tablas decontingencia

Sensibilidad yespecificidad

Tipo de muestreo

Tipo de muestreo:verosimilitud

Un ejemplo

Comparacion de dosproporciones

Asociacion parcialen tablas 2× 2

estratificadas

Tablas I × J

6 / 40

Son independientes si

πij = πi+π+j.

En particular, la condicionada es igual a lamarginal.

πj|i = π+j con j = 1, . . . , J.

Si X e Y son variables respuesta entonceshablamos de independencia.Si Y es respuesta y X explicativa hablamos dehomogeneidad.

Page 9: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

Tablas de contingencia

Probabilidad ytablas decontingencia

Distribucionconjunta y tabla decontingencia

DistribucioncondicionalIndependencia yhomogeneidad

Tablas decontingencia

Tablas decontingencia

Sensibilidad yespecificidad

Tipo de muestreo

Tipo de muestreo:verosimilitud

Un ejemplo

Comparacion de dosproporciones

Asociacion parcialen tablas 2× 2

estratificadas

Tablas I × J

7 / 40

Test positivo Test negativo TotalEnfermo n11 n11 n1+

No enfermo n21 n22 n2+

Total n+1 n+2 n

Distribucion conjunta estimada.πij Test positivo Test negativo Total

Enfermo n11/n n11/n n1+/nNo enfermo n21/n n22/n n2+/n

Total n+1/n n+2/n 1

Page 10: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

Tablas de contingencia

Probabilidad ytablas decontingencia

Distribucionconjunta y tabla decontingencia

DistribucioncondicionalIndependencia yhomogeneidad

Tablas decontingencia

Tablas decontingencia

Sensibilidad yespecificidad

Tipo de muestreo

Tipo de muestreo:verosimilitud

Un ejemplo

Comparacion de dosproporciones

Asociacion parcialen tablas 2× 2

estratificadas

Tablas I × J

8 / 40

Test positivo Test negativo TotalEnfermo n11 n11 n1+

No enfermo n21 n22 n2+

Total n+1 n+2 n

πj|i Test positivo Test negativo TotalEnfermo n11/n1+ n11/n1+ 1

No enfermo n21/n2+ n22/n2+ 1

Page 11: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

Sensibilidad y especificidad

Probabilidad ytablas decontingencia

Distribucionconjunta y tabla decontingencia

DistribucioncondicionalIndependencia yhomogeneidad

Tablas decontingencia

Tablas decontingencia

Sensibilidad yespecificidad

Tipo de muestreo

Tipo de muestreo:verosimilitud

Un ejemplo

Comparacion de dosproporciones

Asociacion parcialen tablas 2× 2

estratificadas

Tablas I × J

9 / 40

πj|i Test positivo Test negativo TotalEnfermo n11/n1+ n11/n1+ 1

No enfermo n21/n2+ n22/n2+ 1

Un ejemplo: en filas indicamos si tiene o no cancer yen columnas el resultado del test.

πj|i Test positivo Test negativo TotalEnfermo 0,82 0,18 1

No enfermo 0,01 0,99 1

Sensibilidad Proporcion de enfermoscorrectamente diagnosticados.

π1|1 = P (Y = 1|X = 1).

Page 12: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

Sensibilidad y especificidad

Probabilidad ytablas decontingencia

Distribucionconjunta y tabla decontingencia

DistribucioncondicionalIndependencia yhomogeneidad

Tablas decontingencia

Tablas decontingencia

Sensibilidad yespecificidad

Tipo de muestreo

Tipo de muestreo:verosimilitud

Un ejemplo

Comparacion de dosproporciones

Asociacion parcialen tablas 2× 2

estratificadas

Tablas I × J

9 / 40

πj|i Test positivo Test negativo TotalEnfermo n11/n1+ n11/n1+ 1

No enfermo n21/n2+ n22/n2+ 1

Un ejemplo: en filas indicamos si tiene o no cancer yen columnas el resultado del test.

πj|i Test positivo Test negativo TotalEnfermo 0,82 0,18 1

No enfermo 0,01 0,99 1

Sensibilidad Proporcion de enfermoscorrectamente diagnosticados.

π1|1 = P (Y = 1|X = 1).

Page 13: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

Tipo de muestreo

Probabilidad ytablas decontingencia

Distribucionconjunta y tabla decontingencia

DistribucioncondicionalIndependencia yhomogeneidad

Tablas decontingencia

Tablas decontingencia

Sensibilidad yespecificidad

Tipo de muestreo

Tipo de muestreo:verosimilitud

Un ejemplo

Comparacion de dosproporciones

Asociacion parcialen tablas 2× 2

estratificadas

Tablas I × J

10 / 40

¿Como hemos obtenido la muestra?

Muestreo de Poisson: Los conteos Yij sonvariables Poisson independientes con medias µij .Muestreo multinomial: Fijamos el tamano totaln pero no los totales de fila y columna.Muestreo multinomial independiente:

Fijamos los totales de fila considerando Y comovariable respuesta y X como explicativa.

Page 14: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

Tipo de muestreo: verosimilitud

Probabilidad ytablas decontingencia

Distribucionconjunta y tabla decontingencia

DistribucioncondicionalIndependencia yhomogeneidad

Tablas decontingencia

Tablas decontingencia

Sensibilidad yespecificidad

Tipo de muestreo

Tipo de muestreo:verosimilitud

Un ejemplo

Comparacion de dosproporciones

Asociacion parcialen tablas 2× 2

estratificadas

Tablas I × J

11 / 40

Muestreo de Poisson

i

j

e−µijµ

nij

ij

nij!

Muestreo multinomial

n!∏

i

j nij!

i

j

πnij

ij .

Muestreo multinomial independiente

i

ni+!∏

j nij!

j

πnij

j|i .

Page 15: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

Un ejemplo

12 / 40

Accidente mortal Accidente no mortalCon cinturonSin cinturon

Vamos a recoger todos los accidentes del proximo mes. Nofijamos el numero total. Muestreo de Poisson.Tomamos un muestra aleatoria de 200 accidentes que tuvieronlugar el mes pasado. Fijamos el tamano total de la muestra.Muestreo multinomial.Tomamos una muestra de 100 accidentes donde hubo muertos yotros 100 en los que no hubo muertos. Fijamos los totales decolumna. Muestreo multinomial (binomial aquı) independiente.

Page 16: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

Comparacion de dos proporciones

Probabilidad ytablas decontingencia

Comparacion de dosproporciones

Comparacion de dosproporciones

¿Comocomparamos?

Odds y odds ratio

Propiedades delodds ratio

Nota de R

Asociacion parcialen tablas 2× 2

estratificadas

Tablas I × J

13 / 40

Page 17: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

Comparacion de dos proporciones

Probabilidad ytablas decontingencia

Comparacion de dosproporciones

Comparacion de dosproporciones

¿Comocomparamos?

Odds y odds ratio

Propiedades delodds ratio

Nota de R

Asociacion parcialen tablas 2× 2

estratificadas

Tablas I × J

14 / 40

Muchos estudios se disenan para comparar gruposbasandonos en una respuesta binaria, Y .Con dos grupos tenemos una tabla decontingencia 2 × 2.

Page 18: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

Comparacion de dos proporciones

Probabilidad ytablas decontingencia

Comparacion de dosproporciones

Comparacion de dosproporciones

¿Comocomparamos?

Odds y odds ratio

Propiedades delodds ratio

Nota de R

Asociacion parcialen tablas 2× 2

estratificadas

Tablas I × J

14 / 40

Muchos estudios se disenan para comparar gruposbasandonos en una respuesta binaria, Y .Con dos grupos tenemos una tabla decontingencia 2 × 2.

Page 19: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

Comparacion de dos proporciones

Probabilidad ytablas decontingencia

Comparacion de dosproporciones

Comparacion de dosproporciones

¿Comocomparamos?

Odds y odds ratio

Propiedades delodds ratio

Nota de R

Asociacion parcialen tablas 2× 2

estratificadas

Tablas I × J

14 / 40

Muchos estudios se disenan para comparar gruposbasandonos en una respuesta binaria, Y .Con dos grupos tenemos una tabla decontingencia 2 × 2.

Page 20: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

Comparacion de dos proporciones

Probabilidad ytablas decontingencia

Comparacion de dosproporciones

Comparacion de dosproporciones

¿Comocomparamos?

Odds y odds ratio

Propiedades delodds ratio

Nota de R

Asociacion parcialen tablas 2× 2

estratificadas

Tablas I × J

14 / 40

Muchos estudios se disenan para comparar gruposbasandonos en una respuesta binaria, Y .Con dos grupos tenemos una tabla decontingencia 2 × 2.

1 21 π1|1 π2|1

2 π1|2 π2|2

Page 21: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

Comparacion de dos proporciones

Probabilidad ytablas decontingencia

Comparacion de dosproporciones

Comparacion de dosproporciones

¿Comocomparamos?

Odds y odds ratio

Propiedades delodds ratio

Nota de R

Asociacion parcialen tablas 2× 2

estratificadas

Tablas I × J

14 / 40

Muchos estudios se disenan para comparar gruposbasandonos en una respuesta binaria, Y .Con dos grupos tenemos una tabla decontingencia 2 × 2.

Exito FracasoGrupo 1 π1|1 π2|1

Grupo 2 π1|2 π2|2

Page 22: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

Comparacion de dos proporciones

Probabilidad ytablas decontingencia

Comparacion de dosproporciones

Comparacion de dosproporciones

¿Comocomparamos?

Odds y odds ratio

Propiedades delodds ratio

Nota de R

Asociacion parcialen tablas 2× 2

estratificadas

Tablas I × J

14 / 40

Muchos estudios se disenan para comparar gruposbasandonos en una respuesta binaria, Y .Con dos grupos tenemos una tabla decontingencia 2 × 2.

Exito FracasoGrupo 1 π1|1 π2|1

Grupo 2 π1|2 π2|2

π1|i = πi

π2|i = 1 − π1|i = 1 − πi

Page 23: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

Comparacion de dos proporciones

Probabilidad ytablas decontingencia

Comparacion de dosproporciones

Comparacion de dosproporciones

¿Comocomparamos?

Odds y odds ratio

Propiedades delodds ratio

Nota de R

Asociacion parcialen tablas 2× 2

estratificadas

Tablas I × J

14 / 40

Muchos estudios se disenan para comparar gruposbasandonos en una respuesta binaria, Y .Con dos grupos tenemos una tabla decontingencia 2 × 2.

Exito FracasoGrupo 1 π1 1 − π1

Grupo 2 π2 1 − π2

Page 24: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

Comparacion de dos proporciones

Probabilidad ytablas decontingencia

Comparacion de dosproporciones

Comparacion de dosproporciones

¿Comocomparamos?

Odds y odds ratio

Propiedades delodds ratio

Nota de R

Asociacion parcialen tablas 2× 2

estratificadas

Tablas I × J

14 / 40

Muchos estudios se disenan para comparar gruposbasandonos en una respuesta binaria, Y .Con dos grupos tenemos una tabla decontingencia 2 × 2.

Exito FracasoGrupo 1 π1 1 − π1

Grupo 2 π2 1 − π2

Queremos comparar π1 con π2.

Page 25: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

¿Como comparamos?

Probabilidad ytablas decontingencia

Comparacion de dosproporciones

Comparacion de dosproporciones

¿Comocomparamos?

Odds y odds ratio

Propiedades delodds ratio

Nota de R

Asociacion parcialen tablas 2× 2

estratificadas

Tablas I × J

15 / 40

Podemos estudiar la diferencia de las proporciones

π1 − π2.

O el riesgo relativo:

π1

π2.

O bien el cociente de odds (odds ratio)

θ =π1/(1 − π1)

π2/(1 − π2).

Page 26: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

Odds y odds ratio

Probabilidad ytablas decontingencia

Comparacion de dosproporciones

Comparacion de dosproporciones

¿Comocomparamos?

Odds y odds ratio

Propiedades delodds ratio

Nota de R

Asociacion parcialen tablas 2× 2

estratificadas

Tablas I × J

16 / 40

Si π es la probabilidad de exito entonces los oddsse definen como

Ω =π

1 − π.

Equivalentemente

π =Ω

Ω + 1.

En una tabla 2 × 2 tenemos los odds en la fila i

Ωi =πi

1 − πi

.

Page 27: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

Probabilidad ytablas decontingencia

Comparacion de dosproporciones

Comparacion de dosproporciones

¿Comocomparamos?

Odds y odds ratio

Propiedades delodds ratio

Nota de R

Asociacion parcialen tablas 2× 2

estratificadas

Tablas I × J

17 / 40

El cociente de los odds de las dos filas sera el oddsratio.

θ =π1/(1 − π1)

π2/(1 − π2).

Se tiene facilmente que

θ =π11π22

π12π21.

Por ello tambien se le llama el cociente de losproductos cruzados.

Page 28: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

Propiedades del odds ratio

Probabilidad ytablas decontingencia

Comparacion de dosproporciones

Comparacion de dosproporciones

¿Comocomparamos?

Odds y odds ratio

Propiedades delodds ratio

Nota de R

Asociacion parcialen tablas 2× 2

estratificadas

Tablas I × J

18 / 40

Puede ser cualquier valor positivo.θ = 1 significa que no hay asociacion entre X eY .Valores de θ alejados de 1 indican una asociacionmayor.Se suele trabajar con log θ pues entonces el valorque tenemos es simetrico respecto a cero.El odds ratio no cambia cuando intercambiamosfilas y columnas.

Page 29: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

Nota de R

Probabilidad ytablas decontingencia

Comparacion de dosproporciones

Comparacion de dosproporciones

¿Comocomparamos?

Odds y odds ratio

Propiedades delodds ratio

Nota de R

Asociacion parcialen tablas 2× 2

estratificadas

Tablas I × J

19 / 40

notaR/notaR004.pdf

Page 30: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

Asociacion parcial en tablas 2 × 2

estratificadas

Probabilidad ytablas decontingencia

Comparacion de dosproporciones

Asociacion parcialen tablas 2× 2

estratificadas

El problema

Un ejemplo

¿Por que?

Nota de ROdds ratioscondicionales ymarginales

Independenciamarginal eindependenciacondicionadaAsociacionhomogenea

Tablas I × J

20 / 40

Page 31: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

El problema

Probabilidad ytablas decontingencia

Comparacion de dosproporciones

Asociacion parcialen tablas 2× 2

estratificadas

El problema

Un ejemplo

¿Por que?

Nota de ROdds ratioscondicionales ymarginales

Independenciamarginal eindependenciacondicionadaAsociacionhomogenea

Tablas I × J

21 / 40

Cuando estudiamos el efecto de X sobre Ydebemos de controlar las covariables que puedeninfluir en la relacion.Lo mejor es mantener las covariables relevantesconstantes.Un efecto de X sobre Y puede representar unefecto de la (o las) covariables sobre las variablesX e Y .Esto no es facil en estudios observacionales.

Page 32: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

Un ejemplo

Probabilidad ytablas decontingencia

Comparacion de dosproporciones

Asociacion parcialen tablas 2× 2

estratificadas

El problema

Un ejemplo

¿Por que?

Nota de ROdds ratioscondicionales ymarginales

Independenciamarginal eindependenciacondicionadaAsociacionhomogenea

Tablas I × J

22 / 40

Consideramos los procesamientos por asesinatosmultiples en Florida entre 1976 y 1987.

Pena de muerteVıctima Acusado Si No % Sı

Blanco Blanco 53 414 11,3Negro 11 37 22,9

Negro Blanco 0 16 0,0Negro 4 139 2,8

Total Blanco 53 430 11,0Negro 15 176 7,9

Page 33: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

23 / 40

Se condena a muerte mas a los blancos que a los negros enEstados Unidos. En el paıs de la igualdad se discrimina a losblancos.

Page 34: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

23 / 40

Se condena a muerte mas a los blancos que a los negros enEstados Unidos. En el paıs de la igualdad se discrimina a losblancos.

Page 35: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

23 / 40

Se condena a muerte mas a los blancos que a los negros enEstados Unidos. En el paıs de la igualdad se discrimina a losblancos.Consideramos como covariable la raza de la vıctima.

Page 36: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

23 / 40

Se condena a muerte mas a los blancos que a los negros enEstados Unidos. En el paıs de la igualdad se discrimina a losblancos.

Pena de muerteVıctima Acusado Si No % Sı

Blanco Blanco 53 414 11,3Negro 11 37 22,9

Negro Blanco 0 16 0,0Negro 4 139 2,8

Total Blanco 53 430 11,0Negro 15 176 7,9

Page 37: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

23 / 40

Se condena a muerte mas a los blancos que a los negros enEstados Unidos. En el paıs de la igualdad se discrimina a losblancos.En el paıs de la igualdad se condena mas a los negros.

Page 38: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

¿Por que?

24 / 40

La explicacion tiene que venir de la asociacion existente entre laraza de la vıctima y las variables que cruzamos marginalmente.Hay una gran asociacion entre raza de vıctima y raza delacusado (odds ratio de 87)

Vıctima vs acusado Vıctima vs veredictoBlanco Negro

Blanco 467 48Negro 16 143

Si NoBlanco 64 451Negro 4 155

Page 39: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

Probabilidad ytablas decontingencia

Comparacion de dosproporciones

Asociacion parcialen tablas 2× 2

estratificadas

El problema

Un ejemplo

¿Por que?

Nota de ROdds ratioscondicionales ymarginales

Independenciamarginal eindependenciacondicionadaAsociacionhomogenea

Tablas I × J

25 / 40

Los blancos tienden a matar mas a blancos.Si matas a un blanco tienes una mayorprobabilidad de que te condenen.Esto es un ejemplo de la paradoja de Simpson(1951).

Page 40: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

Nota de R

Probabilidad ytablas decontingencia

Comparacion de dosproporciones

Asociacion parcialen tablas 2× 2

estratificadas

El problema

Un ejemplo

¿Por que?

Nota de ROdds ratioscondicionales ymarginales

Independenciamarginal eindependenciacondicionadaAsociacionhomogenea

Tablas I × J

26 / 40

Datos de asesinatos multiples en Florida:notaR/notaR007.pdf

Page 41: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

Odds ratios condicionales y marginales

Probabilidad ytablas decontingencia

Comparacion de dosproporciones

Asociacion parcialen tablas 2× 2

estratificadas

El problema

Un ejemplo

¿Por que?

Nota de ROdds ratioscondicionales ymarginales

Independenciamarginal eindependenciacondicionadaAsociacionhomogenea

Tablas I × J

27 / 40

Las asociaciones marginales y condicionalespueden ser descritas mediante el odds ratio.Supongamos una tabla 2 × 2 × K.Tenemos µijk, frecuencia esperada en la celdacorrespondiente.Fijamos Z = k, y tenemos

θXY (k) =µ11kµ22k

µ12kµ21k

que serıan los odds ratio condicionales.Los odds ratio marginales serıan

θXY =µ11+µ22+

µ12+µ21+

Page 42: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

Probabilidad ytablas decontingencia

Comparacion de dosproporciones

Asociacion parcialen tablas 2× 2

estratificadas

El problema

Un ejemplo

¿Por que?

Nota de ROdds ratioscondicionales ymarginales

Independenciamarginal eindependenciacondicionadaAsociacionhomogenea

Tablas I × J

28 / 40

Sustituyendo los µijk por las frecuenciasobservadas tenemos los odds ratio muestrales.Un valor de uno en un odds ratio suponeindependencia bien marginal (si θXY =) o biencondicionada a que Z = k (si θXY (k) = 1).notaR/notaR010.pdf

Page 43: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

Independencia marginal e independencia

condicionada

29 / 40

La independencia condicionada a Z = k significa

P (Y = j|X = i, Z = k) = P (Y = j|Z = k),

para todo i, j.Si lo anterior es cierto para todo valor de Z entonces se dice queX e Y son condicionalmente independientes dada Z y severifica:

πijk =πi+kπ+jk

π++k

para cualquier i, j, k.La independencia condicional no implica la independenciamarginal.

Page 44: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

Asociacion homogenea

Probabilidad ytablas decontingencia

Comparacion de dosproporciones

Asociacion parcialen tablas 2× 2

estratificadas

El problema

Un ejemplo

¿Por que?

Nota de ROdds ratioscondicionales ymarginales

Independenciamarginal eindependenciacondicionadaAsociacionhomogenea

Tablas I × J

30 / 40

Una tabla 2 × 2 × K tiene una asociacion XYhomogenea cuando

θXY (1) = . . . = θXY (K).

El tipo de asociacion entre X e Y es el mismopara las distintas categorıas de Z.Si existe una asociacion XY homogenea entoncestambien tenemos una asociacion XZ homogeneay una asociacion Y Z homogenea.

Page 45: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

Un ejemplo

Probabilidad ytablas decontingencia

Comparacion de dosproporciones

Asociacion parcialen tablas 2× 2

estratificadas

El problema

Un ejemplo

¿Por que?

Nota de ROdds ratioscondicionales ymarginales

Independenciamarginal eindependenciacondicionadaAsociacionhomogenea

Tablas I × J

31 / 40

X = fumador (si, no)Y = cancer de pulmon (si, no)Z = edad (< 45, 45 − 65, > 65)Los odds ratio observados son

θXY (1) = 1,2 θXY (2) = 3,9 θXY (3) = 8,8

El efecto de fumar se acentua conforme la edad esmayor.

Page 46: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

Tablas I × J

Probabilidad ytablas decontingencia

Comparacion de dosproporciones

Asociacion parcialen tablas 2× 2

estratificadas

Tablas I × J

Medidas resumen deasociacionUn ejemplo:Theil,1970

Tendenciasordinales: paresconcordantes ydiscordantes

32 / 40

Page 47: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

Medidas resumen de asociacion

Probabilidad ytablas decontingencia

Comparacion de dosproporciones

Asociacion parcialen tablas 2× 2

estratificadas

Tablas I × J

Medidas resumen deasociacionUn ejemplo:Theil,1970

Tendenciasordinales: paresconcordantes ydiscordantes

33 / 40

Los ındices mas interpretables son del estilo delcoeficiente de determinacion R2.Sea V (Y ) una medida de variacion de ladistribucion marginal de Y (dada porπ+1, . . . , π+J).Sea V (Y |i) la misma medida para la distribucioncondicionada de Y a X = i, π1|i, . . . , πJ |i.Este tipo de ındices consideran

V (Y ) − E[V (Y |X)]

V (Y )

conE[V (Y |X)] =

i

πi+V (Y |i).

Page 48: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

Un ejemplo: Theil,1970

Probabilidad ytablas decontingencia

Comparacion de dosproporciones

Asociacion parcialen tablas 2× 2

estratificadas

Tablas I × J

Medidas resumen deasociacionUn ejemplo:Theil,1970

Tendenciasordinales: paresconcordantes ydiscordantes

34 / 40

Utilizamos la entropıa

V (Y ) =∑

j

π+j log π+j

Obtenemos el coeficiente de incertidumbre

U = −

i

j πij log(πij/πi+π+j)∑

j π+j log π+j

U = 0 significa que X e Y son independientes.U = 1 significa que para cada i, πj|i = 1 paraalgun j.

Page 49: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

Tendencias ordinales: pares concordantes y

discordantes

35 / 40

Satisfaccion en el trabajo

Ingresos Muy Poco Moderadamente Muy

Dolares insatisfecho insatisfecho satisfecho satisfecho

< 15000 1 3 10 6

15000 − 25000 2 3 10 7

25000 − 40000 1 6 14 12

> 40000 0 1 9 11

Page 50: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

Probabilidad ytablas decontingencia

Comparacion de dosproporciones

Asociacion parcialen tablas 2× 2

estratificadas

Tablas I × J

Medidas resumen deasociacionUn ejemplo:Theil,1970

Tendenciasordinales: paresconcordantes ydiscordantes

36 / 40

Tenemos dos medidas ordinales. Cabe esperar unatendencia monotona.Consideramos pares concordantes si un valormayor de X va asociado a un valor mayor de Y .Un par es discordante cuando un valor mayor deX va asociado a un valor menor de Y .Un par esta empatado cuando coinciden en laclasificacion de X e Y .En el ejemplo tenemos

C = 1331, D = 849.

Parece que hay una tendencia de mayor ingresomayor satisfaccion.

Page 51: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

Probabilidad ytablas decontingencia

Comparacion de dosproporciones

Asociacion parcialen tablas 2× 2

estratificadas

Tablas I × J

Medidas resumen deasociacionUn ejemplo:Theil,1970

Tendenciasordinales: paresconcordantes ydiscordantes

37 / 40

Si X e Y son independientes entonces laprobabilidades de concordancia y discordancia son:

Πc = 2∑

i

j

πij

(

h>i

k>j

πhk

)

,

y

Πd = 2∑

i

j

πij

(

h>i

k<j

πhk

)

Page 52: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

Probabilidad ytablas decontingencia

Comparacion de dosproporciones

Asociacion parcialen tablas 2× 2

estratificadas

Tablas I × J

Medidas resumen deasociacionUn ejemplo:Theil,1970

Tendenciasordinales: paresconcordantes ydiscordantes

38 / 40

Condicionado a que no hay empate lasprobabilidades de concordancia y discordancia son

Πc/

(

Πc + Πd

)

y Πd/

(

Πc + Πd

)

La diferencia de las probabilidades es la gamma(Goodman y Kruskal, 1954):

γ =Πc − Πd

Πc + Πd

Page 53: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

Probabilidad ytablas decontingencia

Comparacion de dosproporciones

Asociacion parcialen tablas 2× 2

estratificadas

Tablas I × J

Medidas resumen deasociacionUn ejemplo:Theil,1970

Tendenciasordinales: paresconcordantes ydiscordantes

39 / 40

La version muestral serıa

γ =C − D

C + D

La gamma trata simetricamente a las variables(como el coeficiente de correlacion).−1 ≤ γ ≤ 1.Si invertimos las categorıas de una variable lagamma cambia de signo.|γ| = 1 significa que hay una relacionperfectamente monotona.

Page 54: GoBack - Universitat de València · Distribucio´n conjunta y tabla de contingencia Distribucio´n condicional ... Muestreo multinomial: Fijamos el taman˜o total n pero no los totales

Probabilidad ytablas decontingencia

Comparacion de dosproporciones

Asociacion parcialen tablas 2× 2

estratificadas

Tablas I × J

Medidas resumen deasociacionUn ejemplo:Theil,1970

Tendenciasordinales: paresconcordantes ydiscordantes

40 / 40

γ = 1 si Πd = 0.γ = −1 si Πc = 0.Independencia implica γ = 0. El recıproco no escierto.Ejemplo de satisfaccion con el trabajo:

γ = 0,221.

Una ligera tendencia se observa de que unosingresos mayores suponen una mayor satisfaccion.notaR/notaR011.pdf