Top Banner
Republica Bolivariana De Venezuela Ministerio Del Poder Popular Para La Educación Superior Instituto universitario Politécnico Santiago Mariño Barcelona, 30 de julio de 2016 Correlación de Spearman y Pearson
15

Correlacion de spearman y pearson

Jan 09, 2017

Download

Education

roxanna_gm2
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Correlacion de spearman y pearson

Republica Bolivariana De VenezuelaMinisterio Del Poder Popular Para La Educación

SuperiorInstituto universitario Politécnico Santiago Mariño

Barcelona, 30 de julio de 2016

Correlación de Spearman y Pearson

Page 2: Correlacion de spearman y pearson

Coeficiente de correlación de Karl Pearson

Dado dos variables, la correlación permite hacer estimaciones del valor de una de ellas conociendo el valor de la otra variable.Los coeficientes de correlación son medidas que indican la situación relativa de los mismos sucesos respecto a las dos variables, es decir, son la expresión numérica que nos indica el grado de relación existente entre las 2 variables y en qué medida se relacionan. Son números que varían entre los límites +1 y -1. Su magnitud indica el grado de asociación entre las variables; el valor r = 0 indica que no existe relación entre las variables; los valores ( 1 son indicadores de una correlación perfecta positiva (al crecer o decrecer X, crece o decrece Y) o negativa (Al crecer o decrecer X, decrece o crece Y).

Page 3: Correlacion de spearman y pearson

PARA INTERPRETAR EL COEFICIENTE DE CORRELACIÓN UTILIZAMOS LA SIGUIENTE ESCALA:

Page 4: Correlacion de spearman y pearson

a) Para datos no agrupados se calcula aplicando la siguiente ecuación:

Ejemplo ilustrativo: Con los datos sobre las temperaturas en dos días diferentes en una ciudad, determinar el tipo de correlación que existe entre ellas mediante el coeficiente de PEARSON.

X 18 17 15 16 14 12 9 15 16 14 16 18 SX =180

Y 13 15 14 13 9 10 8 13 12 13 10 8 SY= 138

Page 5: Correlacion de spearman y pearson

Solución:Se calcula la media aritmética:

Se llena la siguiente tabla:

Page 6: Correlacion de spearman y pearson

Se aplica la fórmula:

Existe una correlación moderadaEn Excel se calcula de la siguiente manera:a) Se inserta la función COEF.DE.CORREL y pulsar en Aceptar. En el cuadro de argumentos de la función, en el recuadro de la Matriz 1 seleccionar las celdas de X, y en el recuadro de la Matriz 2 seleccionar las celdas de Y. Pulsar en Aceptar.

Page 7: Correlacion de spearman y pearson

En estadística, el coeficiente de correlación de Spearman, ρ (rho) es una medida de la correlación (la asociación o interdependencia) entre dos variables aleatorias continuas. Para calcular ρ, los datos son ordenados y reemplazados por su respectivo orden.

El estadístico ρ viene dado por la expresión:

donde D es la diferencia entre los correspondientes estadísticos de orden de x - y. N es el número de parejas.Se tiene que considerar la existencia de datos idénticos a la hora de ordenarlos, aunque si éstos son pocos, se puede ignorar tal circunstancia

Para muestras mayores de 20 observaciones, podemos utilizar la siguiente aproximación a la distribución t de Student

La interpretación de coeficiente de Spearman es igual que la del coeficiente de correlación de Pearson. Oscila entre -1 y +1, indicándonos asociaciones negativas o positivas respectivamente, 0 cero, significa no correlación pero no independencia. La tau de Kendall es un coeficiente de correlación por rangos, inversiones entre dos ordenaciones de una distribución normal bivariante.

Page 8: Correlacion de spearman y pearson

EjemploLos datos brutos usados en este ejemplo se ven debajo.

CI Horas de TV a la semana

106 786 0100 28100 5099 28103 2897 20113 12113 7110 17

Page 9: Correlacion de spearman y pearson

SoluciónEl primer paso es ordenar los datos de la primera columna. Se agregan dos columnas 'orden(i)' y 'orden(t)'Para el orden i, se corresponderán con el número de fila del cuadro, para 99, orden(i) =3 ya que ocupa el 3.er lugar, ordenado de menor a mayorpara el orden t, se debe hacer lo mismo pero ordenando por 'Horas de TV a la semana', para no hacer otro cuadro, la secuencia ordenada quedaría T = { 0, 7, 7, 12, 17, 20, 28, 28, 28, 50 }

Page 10: Correlacion de spearman y pearson

para este caso, el orden sería para cada elemento, respectivamente: orden(t) = { 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 }sin embargo, el valor de orden está dado por el valor promedio de sus posiciones, así para:

7 aparece 2 veces, sumando sus posiciones = ( 2 + 3 ) / 2 = 2.528 aparece 3 veces, sumando sus posiciones = ( 7 + 8 + 9 ) / 3 = 850 aparece 1 vez, sumando sus posiciones = 10 / 1 = 10Después, se crean dos columnas más, una columna "d" que muestra las diferencias entre las dos columnas de orden y, otra columna "d2". Esta última es sólo la columna "d" al cuadrado.

Page 11: Correlacion de spearman y pearson

Después de realizar todo esto con los datos del ejemplo, se debería acabar con algo como lo siguiente:CI (i) Horas de TV a la semana (t) orden(i) orden(t) d d2

86 0 1 1 0 0

97 20 2 6 4 16

99 28 3 8 5 25

100 50 4.5 10 5.5 30.25

100 28 4.5 8 3.5 12.25

103 28 6 8 2 4

106 7 7 2.5 4.5 20.25

110 17 8 5 3 9

113 7 9.5 2.5 7 49

113 12 9.5 4 5.5 30.25

Nótese como el número de orden de los valores que son idénticos es la media de los números de orden que les corresponderían si no lo fueran.

Los valores de la columna d2 pueden ser sumados para averiguar . El valor de n es 10. Así que esos valores pueden ser sustituidos en la fórmula.

De lo que resulta .

Page 12: Correlacion de spearman y pearson
Page 13: Correlacion de spearman y pearson
Page 14: Correlacion de spearman y pearson

Aplicación de la prueba estadística Las observaciones de cada variable se deben ordenar en rangos, así como obtener las diferencias entre los rangos, efectuar la sumatoria y elevar ésta al cuadrado. Educación de algunas madres y calificación de desarrollo mental de los hijos. Calculo de los grados de libertad (gl). gl = numero de parejas - 1 = 8 - 1 = 7  El valor rs calculado se compara con los valores críticos de rs del coeficiente de correlación por rangos de Spearman. El valor crítico de rs con 7 grados de libertad, para una probabilidad de 0.05 del nivel de significancia es 0.714, o sea, mayor que el calculado.  Por lo tanto, éste tiene una probabilidad mayor que 0.05. Decisión Como el valor de probabilidad de rs de 0.69 es mayor que 0.05, se acepta Ho y se rechaza Ha.  Interpretación El coeficiente de correlación de Spearman de 0.69 es menor que los valores críticos de la tabla, pues a éstos corresponde la probabilidad de obtener esa magnitud, al nivel de confianza de 0.05 y 0.01, para 0.714 y 0.893. Esto significa que para aceptar Ha, se requiere tener un valor igual o más lato que 0.714. Por lo tanto se acepta Ho y se rechaza Ha, aun cuando, como se observa en la siguiente figura, existe una asociación relativa entre la educación formal de la madre y el desarrollo mental de sus hijos; sin embargo, ésta no es significativa.