Correlación Muestral entre dos Variables
Perfilado de sección
-
-
La correlación es una medida estadística que indica el grado de relación entre dos variables. Dos variables están relacionadas cuando al variar los valores de una variable también cambian los valores de la otra variable. Por ejemplo, si al aumentar la variable A también aumenta la variable B, existe una correlación entre las variables A y B.
-
Según cómo sea la relación que hay entre dos variables aleatorias, se distinguen los siguientes tipos de correlación lineal:
- Correlación directa (o correlación positiva): una variable aumenta cuando la otra también aumenta.
- Correlación inversa (o correlación negativa): cuando una variable aumenta la otra disminuye, y al revés, si una variable disminuye la otra aumenta.
- Correlación nula (sin correlación): no existe ninguna relación entre las dos variables.
Ten en cuenta que estos son los diferentes tipos de correlación lineal que hay, pero también puede ser que la relación matemática entre dos variables no se pueda representar con una recta, sino que se debe utilizar una función más compleja, como por ejemplo una parábola o un logaritmo. En tal caso sería una correlación no lineal.
-
El coeficiente de correlación, también llamado coeficiente de correlación lineal o coeficiente de correlación de Pearson, es el valor de la correlación entre dos variables.
El coeficiente de correlación de dos variables estadísticas es igual al cociente entre la covarianza de las variables y la raíz cuadrada del producto de la varianza de cada variable. Por lo tanto, la fórmula para calcular el coeficiente de correlación es la siguiente:
Cuando se calcula el coeficiente de correlación sobre una población, el símbolo de la correlación es la letra griega ρ. Pero cuando se está calculando el coeficiente respecto a una muestra suele usarse como símbolo la letra r.
El valor del índice de correlación puede estar entre -1 y +1, ambos incluidos. Más abajo veremos cómo se interpreta el valor del coeficiente de correlación.
-
En el siguiente video puedes ver un ejemplo de cómo calcular el coeficiente de relación entre dos variables.
-
El valor del coeficiente de correlación puede ir desde -1 hasta +1, ambos incluidos. Así pues, según el valor del coeficiente de correlación, significa que la relación entre las dos variables es de una forma u otra. A continuación, se explica cómo interpretar el valor de la correlación:
- r=-1: las dos variables tienen una correlación perfecta negativa, por lo que se puede trazar una recta con pendiente negativa en la que se encuentren todos los puntos.
- -1<r<0: la correlación entre las dos variables es negativa, por lo tanto, cuando una variable aumenta la otra disminuye. Cuanto más cerca esté el valor de -1 significa que más relacionadas negativamente están las variables.
- r=0: la correlación entre las dos variables es muy débil, de hecho, la relación lineal entre ellas es nula. Esto no significa que las variables sean independientes, ya que podrían tener una relación no lineal.
- 0<r<1: la correlación entre las dos variables es positiva, cuanto más cerca esté el valor de +1 más fuerte es la relación entre las variables. En este caso, una variable tiende a incrementar su valor cuando la otra también aumenta.
- r=1: las dos variables tienen una correlación perfecta positiva, es decir, tienen una relación lineal positiva.
Como puedes ver en los gráficos de dispersión de arriba, cuanto más fuerte es la correlación entre dos variables más juntos están los puntos en el gráfico. Por otro lado, si los puntos están muy separados entre sí significa que la correlación es débil.
-