Estadisitca Bidimensional
Post on 03-Feb-2016
240 Views
Preview:
DESCRIPTION
Transcript
ESTADÍSTICA DESCRIPTIVA BIDIMENSIONAL
tinaramirez24@hotmail.com
Mg. AGUSTINA RAMÍREZ TORRES
LOGRO DE APRENDIZAJE:
Al finalizar la clase, el estudiante elabora e interpreta tablas bivariadas de los problemas planteados, para determinar la relación de dos variables demostrando su capacidad de análisis y precisión de resultados.
ESTADÍSTICA BIDIMENSIONAL
Analiza el comportamiento conjunto de dos variables en una unidad de estudio, es decir busca la asociación o relación que existe entre ambas variables, se representa como un conjunto de pares de datos (X,Y), donde:
X : es la variable independiente (llamado factor)
Y : es la variable dependiente (llamado resultado)
Ejemplos:• Estrés laboral y desempeño de los trabajadores• Gasto en publicidad y volumen de ventas • Nivel de estudios y región de procedencia• Ingresos y nivel socioeconómico • Cociente intelectual y rendimiento académico
La relación o asociación de variables se da entre:
I. Dos variables cualitativas; carrera profesional y género; Nivel de satisfacción y nivel de estudios, Nivel de pobreza y Zona de residencia.
II. Dos variables cuantitativas; Ingresos y gastos en una familia, Precio de PC y la velocidad del procesador.
III. Una variable cualitativa y una cuantitativa; Nivel de estudios y sueldo de las personas; Zona de ventas y volumen de ventas.
PRESENTACIÓN DE DATOS BIVARIADOS
Variable aleatoria 1
Varia
ble
ale
ator
ia 2
Tablas de contingencia
Masculino Femenino0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
36%
16%18%
30%
DepresiónSin depresión
Gráfico de barras agrupadas
Grupo 1 Grupo 2 Total
Factor 1 1 (a) 2 (b)
Factor 2 3 (c) 4 (d)
Total Total (n)
ORGANIZACIÓN Y PRESENTACIÓN DE DATOS
La asociación o relación de dos variables se debe resumir los resultados en:• Tablas de frecuencias bidimensionales o contingencia• Gráfico de barras agrupadas
Var Y
Var X y1 y2 ... yj ... yl
x1 f11 f12… f1j
… f1l f1.
x2 f21 f22… f2j
… f2l f2.
…… …
……
……
…
xi fi1 fi2… fij
… fil fi.
…… …
……
…… …
xk fk1 fk2… fkj
… fkl fk.
f.1 f.2… f.j
… f.l
k
1i.i.i nf
1jj.j. nf nfn
k
1i 1jij..
Donde:Las frecuencias absolutas conjuntas se designa con el índice ij es decir: fij
La suma de los totales se considera de tres formas:
a) Totales por fila; es la suma total de las frecuencias absolutas en fila:
b) Totales por columna; es la suma total de las frecuencias absolutas en columna:
c) Total general; es la suma total de las frecuencias absolutas: f.. (igual a n)
.if
jf.
Para obtener los porcentajes, llamadas también frecuencias relativas o proporciones, existen tres maneras:
a) Con relación al total general, está dado por:
b) Con relación al total de fila :
c) Con relación al total de columna :
n
fh ij
ij
..
i
iji f
fh
j
ijj f
fh
..
a) Distribución marginal de X; está dado por las marcas de clase (Xi) y por los totales de las frecuencia por filas (fi.) :
b) Distribución marginal de Y; está dado por las marcas de clase (Yj) y por los totales de las frecuencias por columnas (f.j) :
X fi.x1 f1.
x2 f2.
: :xk fk.
Total ni.
Y f.jy1 f.j
y2 f.j: :yl f.l
Total n.j
Distribuciones marginales
Variable de estudio
Varia
ble
secu
ndar
iaTABLAS DE CONTINGENCIA
Grupo 1 Grupo 2 Total
Factor 1 1 (a) 2 (b) Marginal (a+b)
Factor 2 3 (c) 4 (d) Marginal (b+c)
Total Marginal (a+c) Marginal (b+d) Total (n)
Variable de estudio
Es la variable que identifica la línea de investigación
Variable aleatoria
Es la variable cuya distribución se va a conocer con la recogida de los datos
Variable fija
Es la variable cuya distribución se conoce antes de realizar el estudio
Ejemplo. comparar el rendimiento académico de 30
estudiantes de la sección A y 35 estudiantes de la sección B
Grupo 1 Grupo 2
Factor 1
Factor 2
100%
Variable aleatoria
Varia
ble
ale
ator
iaTABLAS DE CONTINGENCIA
(Objetivo asociar)
La municipalidad del distrito de Ventanilla está interesada en averiguar si el nivel de estudios de sus pobladores está asociado a la región de procedencia, para ello ha seleccionado un grupo de personas que se encuentran registradas en la RENIEC correspondientes a su distrito.Los resultados se presentan en la siguiente tabla de frecuencias bidimensional.
EJEMPLO 1:
Presentación de resultados
Región de procedencia
Nivel de estudios TotalPrimaria Secundaria Superior
n % n % n % n %
Costa40 10.7 80 21.3 60 16.0 180 48.0
Sierra 35 9.3 35 9.3 30 8.0 100 26.7
Selva 30 8.0 40 10.7 25 6.7 95 25.3
Total 105 28.0 155 41.3 115 30.7 375 100.0
Tabla1. Nivel de estudios de pobladores de Ventanilla por región de procedencia
De las 375 personas encuestadas, 40 son de la costa y tienen grado de instrucción primaria y son el 10.7%, 35 son de la sierra y tienen secundaria y son el 9.3%, ….40 son de la selva y tienen secundaria y son el 10.7%, …. Se observa en la tabla 1, que las personas mayormente han alcanzado estudios secundarios, el 21.3% son de la costa, el 10.7% de la selva y el 9.3% son de la selva.
Gráfico 1. Nivel de estudios de pobladores de Ventanilla por región de procedencia
Costa Sierra Selva0
5
10
15
20
25
10.79.3
8.0
21.3
9.3
10.7
16.0
8.06.7
Primaria Secundaria Superior
Frec
uenc
ia (%
)
De acuerdo a la región de procedencia, el nivel de estudios que mayormente han alcanzado los pobladores de Ventanilla, es secundaria; el 21.3% para los que son de la costa, el 9.3% para los de la sierra y el 10.3% los que han migrado de la selva
Grupo 1 Grupo 2
Factor 1
Factor 2
100% 100% 100%
Variable fija
Varia
ble
ale
ator
iaTABLAS DE CONTINGENCIA
(Objetivo comparar)
Grupo 1 Grupo 2
Factor 1 100%
Factor 2 100%
100%
Variable aleatoria
Varia
ble
fjia
TABLAS DE CONTINGENCIA (Objetivo comparar)
Área de residencia
Nivel de pobreza TotalNo pobre Pobre no extremo Pobre extremo
n % n % n % n %
Urbana2336 270 10 2616 100
Rural 203 20 9 232 100
Total 2539 290 19 2848 100
EJEMPLO 2.En la encuesta nacional de hogares realizada por el INEI en el 2012, se ha registrado la zona de residencia y el nivel de pobreza de los hogares del departamento de Lima.1) Hallar los porcentajes por fila de las familias del departamento
de Lima2) Interpretar : f11, h23%, f1. , f.2
Tabla 2. Nivel de pobreza según región de procedencia
a) Media o promedio de la variable X :
b) Media o promedio de la variable Y :
c) Varianza de la variable X :
d) Varianza de la variable Y :
e) Covarianza de la variable X e Y : mide la variabilidad de X e Y
n
fxx
k
iii
1.
n
fy
y
l
jjj
1.
Resumen de estadísticos (Datos cuantitativos bivariados)
n
xxf
S
k
1i
2i.i
2x
n
yyf
S
l
1j
2ij.
2y
n
yyxxf
yxCov
k
i
l
jjiij
1 1,
a) Covarianza: mide la variabilidad conjunta de X e Y
MEDIDAS DE ASOCIACIÓN
n
yyxxf
yxCov
k
i
l
jjiij
1 1,
b) Coeficiente de correlación de Pearson : mide el grado de asociación lineal entre las variables X e Y, se simboliza con R
1R1:Donde yx SS
)Y,Xcov(R
Grado de relación de variables
Muy baja Baja Moderada Alta Muy alta
0 0.2 0.4 0.6 0.8 1
Interpretación del coeficiente de correlación de Pearson:
Punto de corte
?
EJEMPLO 3Se ha recolectado la estatura (X) en cm y su peso (Y) en kg de un grupo de estudiantes cuyos resultados se muestran en la tabla de distribución de frecuencias bidimensionales.
Estatura en cm
Peso en kg[50, 60> [60, 70> [70, 80>
[160, 165> 12 18 3
[165, 170> 15 25 8
[170, 175> 4 10 5
[175, 180> 1 3 10
a) Hallar las distribuciones marginalesb) Interprete f22 , f33 , f41, f1. , f.2 , h12%, h2.%, c) Encuentre e interprete el peso y la talla promediod) Encuentre la covarianza entre peso y estatura e) Hallar e interpretar el coeficiente de correlación de Pearson
top related