Bioestadistica 1
Ac. Fabrizio Marcillo Morla MBA
[email protected]://www.facebook.com/barcillo094-194239
Capitulo 3
Entendiendo las Relaciones
Percentil y Cuartil Percentil (0 < p < 1) es el valor de la variable en
donde hay una proporción p de valores de la población menores o iguales.
Cuartiles: dividen poblacion en 4 cuantiles: Q1(25%, 50% y 75%
Excel: =CUARTIL(Datos,Cuartil) =PERCENTIL(Datos,p%)
Rango intercuartílico IQR: rango entre el 50% de elementos centrales de la distribución (Q3 – Q1)
Diagrama de Cajas Tukey 1977: Box and whisker plot (diagrama de
caja y bigote) Resumen de 5 numeros:
Centro: Mediana Dispersión: IQR (Q3 – Q1) Mayor y Menor Puede incluir datos atipicos fuera del grafico
Excel No los crea directamente: Data Desk XL add-in Grafico de cotizaciones (incompleto) Truco con Barras apiladas Ejercicio08 - Diagrama de Cajas.xlsx
Diagrama de Cajas
Permiten apreciar de forma grafica rapidamente la forma de la poblacion, su tendencia, sesgo y distribucion.
Permiten comparar poblaciones.
Diagrama Dispersión Se usa para ver la relación de dos variables cuantitativas
medidas en los mismos elementos. Gráfico en el cual van a estar representados, mediante
puntos, los valores de nuestros pares de variables (x,y). Sirve para darnos una idea visual del tipo de relación que
existe entre ambas variables, y debe de ser hecho antes de iniciar cualquier cálculo para evitar trabajos innecesarios
Dirección: Positiva, negativa o nula Forma: Lineal, Exponencial, Logaritmica, etc Fuerza: Baja, Moderada, Alta Valores atipicos
Eje X: Variable independiente, Eje Y: V. Dependiente Excel Grafico dispersión tiene herramientas para
evaluación interactiva de correlación.
Correlación Al observar graficamente una serie de
pares de datos podemos tener una apreciación errada.
La correlación es una medida numerica de la fuerza de una asociacion lineal. Va de -1 a +1: -1: asociacion lineal negativa perfecta +1: asociacion lineal positiva perfecta 0: ninguna asociacion lineal
No distingue variable dependiente de independiente
Regresion Lineal Fijamos valores variable independiente (x), y
observamos variable dependiente (y) de ésta. Lograr ecuación para describir comportamiento y
relacionado con x, dentro rango específico.
y = a + bx Análisis correlación mide, para c/ muestra x y y. Grafica pares para ver relaciones entre ellos. Calcula algunos estadísticos para determinar la
fuerza de la relación Regresión para experimentos reales Correlación para estudios ex post facto
Puede ser usada como comparativa o predictiva.
Mínimos Cuadrados Recta donde cuadrados de diferencias entre
puntos experimentales (x,y) y puntos calculados (x',y') sea mínima.
y’ – y = residual y = a + bx
a: intersección de la recta con el eje Y b: pendiente de la recta.
a =INTERSECCION.EJE(rango Y,rango X) b =PENDIENTE(rango Y,rango X) Herramientas de Analisis
b=xy -
x yN
x -( x )N
22
a =y
N-b
x
N
Coeficiente Correlación r: Coeficiente de correlación de Pearson Mide la relación lineal entre las variables A diferencia de covarianza no tiene unidades Estimador parámetro coeficiente de correlación
poblacional . Es la proporción entre la covarianza de XY y el
producto de sus desviaciones estándar =COEF.DE.CORREL(rango Y,rango X) =PEARSON(rango Y,rango X)
22 )()(
))((
yyxx
yyxx=r
Coeficiente Determinación r2
A menor varianza de residuales respecto a varianza de y, mejor será la predicción. No relación: Var(y’) / Var(y) = 1 Relación perfecta : Var(y’) / Var(y) = 0
1 - Var(y’) / Var(y) = r2
r2: Cuadrado de Coeficiente de Correlación Mide ajuste a la regresión. Proporción de variación en variable y que puede
ser atribuida a una regresión lineal con respecto a la variable x. Resto falta por explicar
r2 ajustado: Toma en cuenta los gdl: y = n-1 y' = n-2
Regresiones No Lineales Existen otros tipos relaciones posibles entre x y y Crecimiento poblacional común regresión exponencial:
a : "índice de Falton“ B: índice de crecimiento relativo.
Grafico en papel semilogarítmico da una línea recta. Datos se linealizan con:
Luego es un caso de regresión lineal.
y = abx
log log logy = a+ x b
Regresiones No Lineales Hay otros casos regresiones no
lineales y mayoría se linealiza de misma forma.
Excel presenta opción de visualizar previamente alguns tipos de regresiones visualmente y calcular su ecuación y r2 mediante la opción Formato de Linea de tendencia en los graficos de dispersión.