Top Banner
REPÚBLICA BOLIVARIANA DE VENEZUELA INSTITUTO UNIVERSITARIO POLITÉCNICO “SANTIAGO MARIÑO” SEDE BARCELONA INGENIERÍA DE INDUSTRIAL Profesor: Pedro Beltrán Sección: Yv Asignatura: Estadística I Bachiller: Andrea Beltrán C.I:25.429.987 COEFICIENTE DE CORRELACIÓN DE PEARSON Y SPEARMAN
12

Coeficiente de correlación de pearson y spearman

Aug 12, 2015

Download

Education

Andrea Beltrán
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Coeficiente de correlación de pearson y spearman

REPÚBLICA BOLIVARIANA DE VENEZUELA

INSTITUTO UNIVERSITARIO POLITÉCNICO

“SANTIAGO MARIÑO”SEDE BARCELONA

INGENIERÍA DE INDUSTRIAL

Profesor:Pedro Beltrán

Sección: YvAsignatura: Estadística I

Bachiller:Andrea Beltrán C.I:25.429.987

COEFICIENTE DE CORRELACIÓN DE PEARSON Y SPEARMAN

Page 2: Coeficiente de correlación de pearson y spearman

COEFICIENTE DE CORRELACIÓN DE PEARSON

En estadística, el coeficiente de correlación de Pearson es una medida de la relación lineal entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente de la escala de medida de las variables.De manera menos formal, podemos definir el coeficiente de correlación de Pearson como un índice que puede utilizarse para medir el grado de relación de dos variables siempre y cuando ambas sean cuantitativas. 

Page 3: Coeficiente de correlación de pearson y spearman

USO COEFICIENTE DE CORRELACIÓN DE PEARSON

PASOS PARA EL CÁLCULO

Halamos la media aritmética. Calculamos la covarianza. Calculamos la desviación típica. Aplicamos la fórmula del coeficiente de correlación lineal.

Page 4: Coeficiente de correlación de pearson y spearman

USO COEFICIENTE DE CORRELACIÓN DE

PEARSONIdentifica el dependiente variable que se probará entre dos observaciones derivadas independientemente. Uno de los requisitos es que las dos variables que se comparan deben observarse o medirse de manera independiente para eliminar cualquier resultado sesgado.

Para cantidades grandes de información, el calculo puede ser tedioso.

Reporta un valor de correlación cercano a 0 como un indicador de que no hay relación linear entre las dos variables.

Reporta un valor de correlación cercano al 1 como indicador de que existe una relación linear positiva entre las dos variables. Un valor mayor a cero que se acerque a 1 da como resultado una mayor correlación positiva entre la información.

Page 5: Coeficiente de correlación de pearson y spearman

COEFICIENTE DE CORRELACIÓN DE

PEARSONVentajas:Cuando en el fenómeno estudiado las dos variables son cuantitativas se usa el coeficiente de correlaciones de Pearson. Es llamado así en homenaje a Karl Pearson. Las dos variables son designadas por X e Y.

Desventajas: El valor 0 representa falta de correlación.

Cuando las variables X e Y son independientes, el numerador se anula y el coeficiente de correlación poblacional tiene el valor cero.

En cambio una correlación nula no implica la independencia de variables.

Page 6: Coeficiente de correlación de pearson y spearman

APLICAR USOS DE ENFOQUES DE PEARSON

PROBLEMAS ESTADÍSTICOS Para la aplicación de person se necesita Identifica el dependiente variable que se probará entre dos observaciones derivadas independientemente. Uno de los requisitos es que las dos variables que se comparan deben observarse o medirse de manera independiente para eliminar cualquier resultado sesgado. Para cantidades grandes de información, el calculo puede ser tedioso. Reporta un valor de correlación cercano a 0 como un indicador de que no hay relación linear entre las dos variables. Reporta un valor de correlación cercano al 1 como indicador de que existe una relación linear positiva entre las dos variables.Un valor mayor a cero que se acerque a 1 da como resultado una mayor correlación positiva entre la información. Reporta un valor de correlación cercano a -1 como indicador de que hay una relación linear negativa entre las dos variables. Interpreta el coeficiente de correlación de acuerdo con el contexto de los datos particulares. El valor de correlación es esencialmente un valor arbitrario que debe aplicarse de acuerdo con las variables que se comparan. Determina la importancia de los resultados.

Page 7: Coeficiente de correlación de pearson y spearman

COEFICIENTE DE CORRELACIÓN DE SPEARMAN

El coeficiente de correlación de Spearman es menos sensible que el de Pearson para los valores muy lejos de lo esperado. En este ejemplo: Pearson = 0.30706 Spearman = 0.76270En estadística, el coeficiente de correlación de Spearman, ρ (rho) es una medida de la correlación (la asociación o interdependencia) entre dos variables aleatorias continuas. Para calcular ρ, los datos son ordenados y reemplazados por su respectivo orden.El estadístico ρ viene dado por la expresión:

donde D es la diferencia entre los correspondientes estadísticos de orden de x - y. N es el número de parejas.Se tiene que considerar la existencia de datos idénticos a la hora de ordenarlos, aunque si éstos son pocos, se puede ignorar tal circunstanciaPara muestras mayores de 20 observaciones, podemos utilizar la siguiente aproximación a la distribución t de Student

La interpretación de coeficiente de Spearman es igual que la del coeficiente de correlación de Pearson. Oscila entre -1 y +1, indicándonos asociaciones negativas o positivas respectivamente, 0 cero, significa no correlación pero no independencia. La tau de Kendall es un coeficiente de correlación por rangos, inversiones entre dos ordenaciones de una distribución normal bivariante.  

Page 8: Coeficiente de correlación de pearson y spearman

Para aplicar el coeficiente de correlación de Spearman se requiere que las variables estén medidas al menos en escala ordinal, es decir, de forma que las puntuaciones que las representan puedan ser colocadas en dos series ordenadas.

A veces, este coeficiente es denominado por la letra griega ρs (rho), aunque cuando nos situamos en el contexto de la Estadística Descriptiva se emplea la notación rs

La fórmula de cálculo para rs puede derivarse de la utilizada en el caso de rxy; bastaría aplicar el coeficiente de correlación de Pearson a dos series de puntuaciones ordinales, compuestas cada una de ellas por los n primeros números naturales

USO COEFICIENTE DE CORRELACIÓN DE SPEARMAN

Page 9: Coeficiente de correlación de pearson y spearman

PROPIEDADES COEFICIENTE DE CORRELACIÓN DE

SPEARMANEl coeficiente de correlación de Spearman se encuentra siempre comprendido entre los valores -1 y 1. Es decir, -1 < rs < 1.

Cuando todos los sujetos se sitúan en el mismo puesto para la variable X y para la variable Y, el valor de rs es 1. Si ocupan valores opuestos, es decir, al primer sujeto en X le corresponde el último lugar en Y, al segundo en X le corresponde el penúltimo en Y, etc., entonces el valor de rs es -1.

Page 10: Coeficiente de correlación de pearson y spearman

COEFICIENTE DE CORRELACIÓN DE SPEARMAN

Ventajas:  Al ser Spearman una técnica no paramétrica es libre de distribución probabilística (2, 5, 9). - Los supuestos son menos estrictos. Es robusto a la presencia de outliers (es decir permite ciertos desvíos del patrón normal).

La manifestación de una relación causa-efecto es posible sólo a través de la comprensión de la relación natural que existe entre las variable y no debe manifestarse sólo por la existencia de una fuerte correlación (1, 5). Desventajas:

Indicándonos asociaciones negativas o positivas respectivamente, 0 cero, significa no correlación pero no independencia.

La tau de Kendall es un coeficiente de correlación por rangos, inversiones entre dos ordenaciones de una distribución normal bivariante. Aplicar usos de enfoques Pearson y enfoque Sperman a problemas estadísticos. 

Page 11: Coeficiente de correlación de pearson y spearman

Para aplicar el coeficiente de correlación de Spearman se requiere que las variables estén medidas al menos en escala ordinal, es decir, de forma que las puntuaciones que las representan puedan ser colocadas en dos series ordenadas. A veces, este coeficiente es denominado por la letra griega ρs (rho), aunque cuando nos situamos en el contexto de la Estadística Descriptiva se emplea la notación rs La fórmula de cálculo para rs puede derivarse de la utilizada en el caso de rxy; bastaría aplicar el coeficiente de correlación de Pearson a dos series de puntuaciones ordinales, compuestas cada una de ellas por la n primeros números naturales. El coeficiente de correlación de Spearman se encuentra siempre comprendido entre los valores -1 y 1. Es decir, -1 < rs < 1. Cuando todos los sujetos se sitúan en el mismo puesto para la variable X y para la variable Y, el valor de rs es 1. Si ocupan valores opuestos, es decir, al primer sujeto en X le corresponde el último lugar en Y, al segundo en X le corresponde el penúltimo en Y, etc., entonces el valor de rs es -1.w

APLICAR USOS DE ENFOQUES SPEARMAN A

PROBLEMAS ESTADÍSTICOS