La covarianza

Además de analizar cómo varía cada una de las variables por separado, sería interesante también tener idea de cómo varían dichas variables conjuntamente, es decir, cómo "covarían".

Se dice que dos variables están variando conjuntamente, y en el mismo sentido, cuando al crecer los valores de una de las variables también aumentan los de la otra.

En cambio, están variando conjuntamente, pero en sentido contrario, cuando al aumentar los valores de una, los de la otra disminuyen.

Definiremos como covarianza de dos variables X e Y, y denotaremos por SXY, el estadístico que nos permite analizar la variación conjunta de dos variables. Viene dado por la siguiente expresión:

Si cada pareja de observaciones (xi,yi) se repitiese un número de veces, deberíamos introducir en la expresión anterior la correspondiente frecuencia, análogamente a como se hace en la expresión de la varianza.

La covarianza, puede ser utilizada como una medida inicial de la asociación lineal entre las dos variables. Para ello, observaremos detenidamente el gráfico de la figura 6.2.


Figura 6.2: Gráfico que pone de manifiesto la importancia de la covarianza como

medida de la asociación lineal

En ella aparece la nube de puntos para un par de variables X e Y. Se pone de manifiesto cómo aquellos pares de valores que ocupan el cuadrante superior derecho (tomando como origen el punto de medias) nos dan como resultado sumandos positivos en la expresión de la covarianza. Lo mismo ocurre con aquellos que se encuentran en el cuadrante inferior izquierdo. Sin embargo, los del cuadrante superior izquierdo e inferior derecho, nos dan sumandos negativos. Ello tiene como consecuencia, que dependiendo del número de observaciones situado en cada uno de dichos cuadrantes, obtendremos un signo diferente en la covarianza, de modo que si predominan las diferencias positivas, esta será positiva, y si predominan las negativas, la covarianza también lo será.

Esto nos lleva a utilizar la covarianza como una medida de la asociación lineal entre las variables, de modo que si ésta es positiva, nos indica una relación directa entre ellas y si es negativa, nos indica una relación inversa. Si las variables son independientes, entonces la covarianza es aproximadamente 0. Un ejemplo, de este último caso se correspondería con la figura 6.3a.


Figura 6.3: Diferentes casos para la covarianza