Análisis Descriptivo Bivariado Saúl Díaz Navarro
Análisis Descriptivo BivariadoSaúl Díaz Navarro
Análisis Descriptivo BivariadoPermite realizar un verdadero
“análisis” (división), que acompañado de las debidas comparaciones genera un escudriño exhaustivo de los datos.
Comparación de Porcentajes y de promedios para ciertos valores de otra variable.
EjemplosComparar el promedio de ventas de
cada uno de los asesores comerciales.Comparar el promedio de
calificaciones de los estudiantes diurnos con el de los estudiantes nocturnos.
Comparar el porcentaje de enfermos entre los que tienen un hábito y entre los que no lo tienen.
Comparar el nivel de calidad de la materia prima de dos proveedores.
Tablas de Contingencia
También llamadas:
Tablas de Doble EntradaCruces de Variables (cross tab)Tablas de 2*2Tablas de distribución de
frecuencia bivariadas
Tablas de Contingencia
Muestran la distribución de frecuencias de una variable, de manera diferenciada, para cada uno de los valores (o grupo de valores) de otra variable.
Tabaquismo y Cáncer de Pulmón
Cantidad de Personas Según Tabaquismo y Aparición de Cáncer
Tabaquismo
No Fuma 4 32 36
Fumador Moderado 21 45 66
Fumador no Moderado 75 22 97
Total 100 99 199
Tabaquismo y Cáncer. Rev médica de chile. 2008 136: 1272-1280
Cáncer No Cáncer Total
Porcentaje Columna
Cantidad de Personas Según Tabaquismo y Aparición de Cáncer
Tabaquismo
No Fuma 4 32 364% 32% 18%
Fumador Moderado 21 45 6621% 45% 33%
Fumador no Moderado 75 22 9775% 22% 49%
Total 100 99 199100% 100% 100%
Tabaquismo y Cáncer. Rev médica de chile. 2008 136: 1272-1280
Cáncer No Cáncer Total
Porcentaje FilaCantidad de Personas Según Tabaquismo y Aparición de Cáncer
Tabaquismo
No Fuma 4 11% 32 89% 36 100%
Fumador Moderado 21 32% 45 68% 66 100%
Fumador no Moderado 75 77% 22 23% 97 100%
Total 100 50% 99 50% 199 100%
Tabaquismo y Cáncer. Rev médica de chile. 2008 136: 1272-1280
Cáncer No Cáncer Total
Porcentaje Total
Cantidad de Personas Según Tabaquismo y Aparición de Cáncer
Tabaquismo
No Fuma 4 32 362% 16% 18%
Fumador Moderado 21 45 6611% 23% 33%
Fumador no Moderado 75 22 9738% 11% 49%
Total 100 99 19950% 50% 100%
Tabaquismo y Cáncer. Rev médica de chile. 2008 136: 1272-1280
Cáncer No Cáncer Total
Tabla CompletaCantidad de Personas Según Tabaquismo y Aparición de Cáncer
Tabaquismo
No Fuma 4 11% 32 89% 36 100%4% 2% 32% 16% 18% 18%
Fumador Moderado 21 32% 45 68% 66 100%21% 11% 45% 23% 33% 33%
Fumador no Moderado 75 77% 22 23% 97 100%75% 38% 22% 11% 49% 49%
Total 100 50% 99 50% 199 100%100% 50% 100% 50% 100% 100%
Tabaquismo y Cáncer. Rev médica de chile. 2008 136: 1272-1280
nij % fila% Col % Total
Cáncer No Cáncer Total
AnálisisCambia la distribución porcentual
de la condición “Cáncer” y “No Cáncer” según los distintos valores de tabaquismo?
Podemos decir que el Tabaquismo es la causa del Cáncer?
Podemos decir que el Cáncer es la causa del Tabaquismo?
Que podemos interpretar?
AnálisisPodemos decir que el
tabaquismo, no afecta la aparición del cáncer?
Aunque no podamos, con un tabla de contingencia, comprobar una relación causa efecto, si podemos encontrar evidencia de asociación o correlación estadística.
Análisis
Las comparación distribución de la aparición de cáncer (Variable respuesta) para entre cada uno de los niveles de tabaquismo (Factor) permite concluir que existe una asociación estadística entre el tabaquismo y la aparición de cáncer.
El tabaquismo es un factor de riesgo asociado a la aparición de cáncer.
Los Valores de Tabaquismo pueden tomar los nombre de X1, X2 y X3.
Los valores de Cáncer pueden tomar los valores Y1 y Y2.
Simbología
Cantidad de Personas Según Tabaquismo y Aparición de Cáncer
Tabaquismo
X1 n11 n12 n1*h11 h12 h1*
X2 n21 n22 n2*h21 h22 h2*
X3 n31 n32 n3*h31 h32 h3*
X* n*1 n*2 n**h*1 h*2 h*3
Tabaquismo y Cáncer. Rev médica de chile. 2008 136: 1272-1280
Y1 Y2 Y*
Simbologia
Cantidad de Personas Según Tabaquismo y Aparición de Cáncer
Tabaquismo
X1 n11 n12 n1*h11 h12 h1*
X2 n21 n22 n2*h21 h22 h2*
X3 n31 n32 n3*h31 h32 h3*
X* n*1 n*2 n**h*1 h*2 h*3
Tabaquismo y Cáncer. Rev médica de chile. 2008 136: 1272-1280
Y1 Y2 Y*
Frecuencias Relativas (Total tabla)
hij = 𝑛𝑖𝑗𝑛
Frecuencia condicional
Es la proporción equivalente al porcentaje columna.
ℎሺ𝑋𝑖 ȁ� 𝑌𝑗) = 𝑛𝑖𝑗𝑛 ∗𝑗
Estudiantes según plan de estudios y Genero Sexual.
GENERO SEXUAL
PLAN DE ESTUDIOS Administració
n Mercadeo Total
Hombre 42 14 56 Mujer 18 6 24 Total 60 20 80
Estudiantes según plan de estudios y Genero Sexual.
La proporción de género sexual cambia según el plan de estudios?
La proporción de plan de estudios, cambia en los distintos géneros sexuales?
Existe alguna asociación estadística entre las variables plan de estudios y género sexual?
Estudiantes según plan de estudios y Genero Sexual.
Distribución de Estudiantes Según Género Sexual y Plan de Estudios.Género Sexual
Administración (Y1) Mercadeo (Y2) Total n i*Masculino 42 70% 18 30% 60 100%
X1 75% 53% 75% 23% 75% 75%Femenino 14 70% 6 30% 20 100%
X2 25% 18% 25% 8% 25% 25%Total n*j 56 70% 24 30% 80 100%
100% 70% 100% 30% 100% 100%
nij % fila nij h(Yj|Xi)% Col % Total h(Xi|Yj) % Total
Plan de Estudios
Estudiantes según plan de estudios y Genero Sexual.
La proporción de género sexual NO cambia según el plan de estudios
La proporción de plan de estudios, NO cambia en los distintos géneros sexuales
NO Existe alguna asociación estadística entre las variables plan de estudios y género sexual. Hay Independencia estadística
Independencia Estadística
.h(Xi / Yj) = h(Xi) para todo i, j
.h(Xi ∩ Yj) = h(Xi) * h(Yj).h(Xi ∩ Yj) = (hi* ) * (h*j)Cuando no hay independencia, habrá
dependencia.
Distribución con Independencia Estadística (Sin dependencia)
Distribución de Estudiantes Según Género Sexual y Plan de Estudios.Género Sexual
Administración (Y1) Mercadeo (Y2) Total n i*Masculino 60
X1 75%Femenino 20
X2 25%Total n*j 56 70% 24 30% 80
nij % fila nij h(Yj|Xi)% Col % Total h(Xi|Yj) % Total
Plan de Estudios
Distribución con Independencia Estadística (Sin dependencia)
Distribución de Estudiantes Según Género Sexual y Plan de Estudios.Género Sexual
Administración (Y1) Mercadeo (Y2) Total n i*Masculino 60
X1 75% 75% 75%Femenino 20
X2 25% 25% 25%Total n*j 56 70% 24 30% 80
nij % fila nij h(Yj|Xi)% Col % Total h(Xi|Yj) % Total
Plan de Estudios
42 (0,7*0,75)= 0,525
Género Sexual Administración (Y1) Mercadeo (Y2) Total n i*
Masculino (0,525*80)X1 (0,7*0,75) 75%
FemeninoX2 25%
Total n*j 70% 30% 80
nij % fila nij h(Yj|Xi)% Col % Total h(Xi|Yj) % Total
Plan de Estudios
Coeficiente de Contigencia h2 de cramer.
Compara la distribución bivariada observada con la distribución bivariado que resultaría bajo la hipótesis de independencia estadística.
0 <= h2 <= 1
H2= 0 Total independencia. No hay dependencia. Caso de Estudiantes por genero y plan de estudios.
H2=1 Nula Independencia. Máximo grado de dependencia.