El Coeficiente de Correlacion Lineal de Pearson

    El coeficiente de correlación lineal de Pearson es una medida estadística que mide la relación lineal entre dos variables cuantitativas. Es una medida que varía entre -1 y 1, y se utiliza para determinar la fuerza y la dirección de la relación entre dos variables. Un valor de -1 indica una correlación lineal negativa perfecta, un valor de 1 indica una correlación lineal positiva perfecta y un valor de 0 indica que no hay correlación lineal entre las dos variables.

La fórmula para calcular el coeficiente de correlación lineal de Pearson es:

r = (nΣxy - ΣxΣy) / √[(nΣx^2 - (Σx)^2) * (nΣy^2 - (Σy)^2)]

donde:

  • n es el número de pares de datos observados
  • Σxy es la suma de los productos de las desviaciones de las dos variables
  • Σx y Σy son las sumas de las desviaciones de cada variable
  • Σx^2 y Σy^2 son las sumas de los cuadrados de las desviaciones de cada variable.

    El coeficiente de correlación lineal de Pearson se utiliza comúnmente en la investigación científica para determinar la relación entre dos variables. Además, se utiliza para realizar pruebas de hipótesis y para estimar la relación entre las variables en el futuro, a partir de los datos existentes. Es importante tener en cuenta que el coeficiente de correlación lineal de Pearson solo mide la relación lineal entre dos variables, y no es adecuado para medir la relación no lineal.


un ejemplo de cómo calcular el coeficiente de correlación lineal de Pearson:

Supongamos que se han recopilado los siguientes datos sobre el número de horas de estudio y la calificación en un examen de matemáticas para un grupo de estudiantes:

Horas de estudioCalificación
260
480
690
8100

Para calcular el coeficiente de correlación lineal de Pearson, primero se deben calcular varias sumas y productos:

  • n = 4 (el número de pares de datos observados)
  • Σx = 20 (la suma de las horas de estudio)
  • Σy = 330 (la suma de las calificaciones)
  • Σx^2 = 120 (la suma de los cuadrados de las horas de estudio)
  • Σy^2 = 20500 (la suma de los cuadrados de las calificaciones)
  • Σxy = 750 (la suma de los productos de las horas de estudio y las calificaciones)

Luego, se pueden utilizar estas sumas y productos para calcular el coeficiente de correlación lineal de Pearson:

r = (nΣxy - ΣxΣy) / √[(nΣx^2 - (Σx)^2) * (nΣy^2 - (Σy)^2)] r = (4 * 750 - 20 * 330) / √[(4 * 120 - 20^2) * (4 * 20500 - 330^2)] = 0.9818 (aproximadamente)

Por lo tanto, el coeficiente de correlación lineal de Pearson para estos datos es de 0.9818, lo que indica una correlación lineal positiva muy fuerte entre las horas de estudio y la calificación en el examen de matemáticas.

Comentarios

Entradas populares de este blog

Durbin-Watson

Graficos de Dispersión para los Residuos

Diagrama de Dispersión