Top Banner
Bioestadística TABLAS DE CONTIGENCIA DE DOS FORMAS 1
19

CLASE1 Tablas de Contigencia 2015

Nov 10, 2015

Download

Documents

Alonso Manrique

Se describe la teoría de tablas de contingencia
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
  • Bioestadstica

    TABLAS DE CONTIGENCIA DE DOS FORMAS

    1

  • Que se busca ?

    Introducir parmetros que describen la asociacin poblacional entre dos variables categricas.

    Datos Categoricos:

    Consisten en el conteo de frecuencias de ocurrencia de las observaciones categoricas de la variable respuesta.

    Para v. categoricas que tienen solamente dos nivels, se estudia los odds ratios , las diferencia de proporciones y la razon de proporciones.

    2

  • TIPOS DE VARIABLES Cualitativas

    Si sus valores (modalidades) no se pueden asociar naturalmente a un nmero (no se pueden hacer operaciones algebraicas con ellos)

    Nominales: Si sus valores no se pueden ordenar Sexo, Grupo Sanguneo, Religin, Nacionalidad, Fumar (S/No)

    Ordinales: Si sus valores se pueden ordenar Mejora a un tratamiento, Grado de satisfaccin, Intensidad del dolor

    Cuantitativas o NumricasSi sus valores son numricos (tiene sentido hacer operaciones algebraicas con ellos)

    Discretas: Si toma valores enteros Nmero de hijos, Nmero de cigarrillos, Num. de cumpleaos

    Continuas: Si entre dos valores, son posibles infinitos valores intermedios. Altura, Presin intraocular, Dosis de medicamento administrado, edad

    3

  • Estructura para las tablasde dos Dimensiones

    4

    X / Y 1 2 .. j J i+

    1 11 12 1j 1J 1+

    2 21 22 2j 2J 2+

    . .. ..

    i i1 i2 ij iJ i+

    . ..

    .

    I I1 I2 Ij IJ I+

    +j

    +1 +2 +j +J

  • Estructura para las tablas de dos Dimensiones

    Una relacin bivariada es definida por ladistribucin conjunta de dos variablesasociadas.

    La distribucin de probabilidad { TT ij } es ladistribucion conjunta de X e Y .

    Las distribuciones marginales son las filas ycolumnas de totales obtenidas mediante lasuma de probabilidades conjuntas.

    5

  • Estructura para las tablas de dos Dimensiones

    { TT i+ } denota la distribucin marginalpara la variable fila.

    { TT +j } denota la distribucion marginal parala variable columna.

    donde + denota la suma sobre el indice queremplaza, esto es:

    6

  • Estructura para las tablasde dos Dimensiones

    Y donde se verifica que:

    Las distribuciones marginales soninformaciones de una sola variable , yno intervienen la asociacin entre lasvariables.

    7

  • Estructura para las tablasde dos Dimensiones

    En una Tabla de Contingencia ( Person 1904) otabla de clasificacin cruzada, una variable (Y) es una variable respuesta y otra ( X) es unavariable explicativa.

    Cuando X es fijo en vez de aleatorio ,la nocinde distribucin conjunta para X e Y no essignificativa.

    Pero para niveles fijos de X e Y tiene unadistribucin de probabilidad.

    8

  • Estructura para las tablasde dos Dimensiones

    Pero para niveles fijos de X e Y tiene una distribucin de probabilidad.

    Ya que TT j/I denota la probabilidad de clasificacionen la columna j de Y , j= 1,2J

    Y donde:

    Luego: las propabilidades { } forma la distribucin condicional de Y en el nivel de i de X

    9

  • Estructura para las tablas de dos Dimensiones

    Entonces : un objetivo principal en muchosestudios es comparar la distribucincondicional de Y en varios niveles de lasvariables explicativas .

    En otras palabras es usar la funcin deDistribucin condicional ( que es la sumade probabilidad de clasificacin en una de lasprimeras j columna, dado que esta en la fila i.

    10

  • INDEPENDENCIA EN Tablas de dos Dimensiones

    Si ambas variables son variablesrespuestas, se puede describir la asociacinusando su distribucin conjunta,Distribucin condicional de X dada la variableY, o la distribucin condicional de Y dada Xdada:

    11

  • INDEPENDENCIA EN Tablas de dos Dimensiones

    Las variables son estocsticamenteindependientes si todas las probabilidadesconjuntas es igual al producto de susprobabilidades marginales, esto es:

    12

  • INDEPENDENCIA EN Tablas de dos Dimensiones

    Cuando X e Y son independientes se

    Cada distribucin condicional de Y es idntica ala distribucin marginal de Y.

    Luego dos variables son independientes cuandola probabilidad de respuesta columna j es lamisma en cada fila , para j= 1,2 J.

    13

  • INDEPENDENCIA EN Tablas de dos Dimensiones

    Cuando Y es una respuesta e X una variable explicativa, la distribucin condicional esta expresada por :

    queda una definicin mas natural de independencia.

    14

    X / Y 1 2

    1 111/1

    121/2

    1+1

    2 121/2

    222/2

    2+1

    Total +1 +2

  • Formas de Comparar proporciones

    Las variables de respuesta con dos categoras sondenominadas binarias.

    Frecuentemente se comparan varios grupos en unarespuesta binaria Y

    15

    vacuna cura No cura

    A A11 A12

    B A21 A22

    C A31 A23

    D A41 A24

  • Diferencias de proporciones

    Para sujetos en la fila i i= 1,2,..del grupoI, 1/i es la probabilidad respuesta (1). Y ( 1/i ,2/i ) = ( 1/i , 1 - 1/i ) es la distribucincondicional de la respuesta binaria.

    Para comparar dos filas : h e i , usando la diferencia de proporciones seria:

    ( 1/h _ 1/i ) (2) , la respuesta en esta comparacin es equivalente a la comparacin en (1):

    ( 2/h - 2/i ) = ( 1 - 1/h ) - ( 1 _ 1/i ) = 1/i _ 1/h (*)

    16

    X / Y 1 2

    1 111/1

    121/2

    1+1

    2 212/1

    222/2

    2+1

    Total +1 +2

    Esta diferencia cae entre -1 a +1. Es igual a cero cuando las filas h e i tienen distribuciones

    condicionales idnticas.

  • Diferencias de proporciones

    Luego la v. respuesta Y es estadsticamente independiente de la clasificacin de la fila i, cuando se cumple que : 1/h - 1/i = 0 , para todo par de filas

    h e i.

    Para tablas de contingencia I x J se puede comparar las probabilides condicionales de la respuesta j para las filas h e i , usando la diferencia j/h - j /i

    17

  • Diferencias de proporciones

    Cuando ambas variables son variables respuestas y existe una distribucin conjunta

    {TT ij }, la comparasion de proporciones dentro de la filah e I satisface :

    1/h - 1/i = h1 / h+ - i1 / i+

    Para el caso 2 x2 :

    P(col 1 /fila 1 ) - P(col 1 /fila 2 )= 11 / 1+ - 21 / 2+

    18

  • Odds Ratio=

    Con respecto a las tablas 2 x 2

    Para la fila 1 , el odds que es la respuesta esta en la columna 1 y esta definido por

    Para una distribucin conjunta la definicin equivalente es:

    i= 1,2

    Cada i es no negativo, con valor mayor que 120

    2

    1

    i

    i

    i

    12

    11

    1

    12

    1

    11

    1/2

    1/1

    1