Correlación estadística

La correlación estadística determina la relación o dependencia que existe entre las dos variables que intervienen en una distribución bidimensional.

Es decir, determinar si los cambios en una de las variables influyen en los cambios de la otra. En caso de que suceda, diremos que las variables están correlacionadas o que hay correlación entre ellas.

Coeficiente de correlación

El coeficiente de correlación lineal se expresa mediante la letra r.

coeficiente de correlación lineal

Propiedades

1. El coeficiente de correlación no varía al hacerlo la escala de medición.

Es decir, si expresamos la altura en metros o en centímetros el coeficiente de correlación no varía.

2. El signo del coeficiente de correlación es el mismo que el de la covarianza.

Si la covarianza es positiva, la correlación es directa.

Si la covarianza es negativa, la correlación es inversa.

Si la covarianza es nula, no existe correlación.

3. El coeficiente de correlación lineal es un número real comprendido entre menos −1 y 1.

−1 ≤ r ≤ 1

4. Si el coeficiente de correlación lineal toma valores cercanos a −1 la correlación es fuerte e inversa, y será tanto más fuerte cuanto más se aproxime r a −1.

5. Si el coeficiente de correlación lineal toma valores cercanos a 1 la correlación es fuerte y directa, y será tanto más fuerte cuanto más se aproxime r a 1.

6. Si el coeficiente de correlación lineal toma valores cercanos a 0, la correlación es débil.

7. Si r = 1 ó −1, los puntos de la nube están sobre la recta creciente o decreciente. Entre ambas variables hay dependencia funcional.


Ejercicios

Las estaturas y pesos de 10 jugadores de baloncesto de un equipo son:

Estatura (X) Pesos (Y)
186 85
189 85
190 86
192 90
193 87
193 91
198 93
201 103
203 100
205 101

Calcular el coeficiente de correlación.


medias

varianzas

desviaciones típicas

coeficiente de correlación

Correlación positiva muy fuerte.


Los valores de dos variables X e Y se distribuyen según la tabla siguiente:

Y/X 100 50 25
14 1 1 0
18 2 3 0
22 0 1 2

Obtener e interpretar el coeficiente de correlación lineal.


Convertimos la tabla de doble entrada en una tabla simple.

xi yi fi xi · fi xi2 · fi yi · fi yi2 · fi xi · yi · fi
100 14 1 100 10 000 14 196 1 400
100 18 2 200 20 000 36 648 3 600
50 14 1 50 2 500 14 196 700
50 18 3 150 7 500 54 972 2 700
50 22 1 50 2 500 22 484 1 100
25 22 2 50 1 250 44 968 1 100
    10 600 43 750 184 3 464 10 600

medias

varianza

desviaciones típicas

covarianza

coeficiente de correlación lineal

Es una correlación negativa débil.