Corrélation et causalité Cours

I

Observer des corrélations

A

Définition

Corrélation

Une corrélation est une relation statistique entre deux variables dont les valeurs varient dans le même sens ou dans le sens opposé.

Si on observe que plus le nombre d'articles produits augmente, plus le salaire de l'ouvrier augmente, on peut penser qu'il y a une corrélation entre la variation du nombre d'articles produits et la variation du salaire de l'ouvrier.

Une corrélation peut être :

  • Positive : les valeurs des variables varient dans le même sens.
  • Négative : les valeurs des variables varient dans le sens contraire.
B

Graphiquement

-

Fréquence du chômage de longue durée en 2008

On pourrait tracer une droite pour représenter le nuage de points. On appelle cette droite "la droite des moindres carrés". Elle représente la tendance générale du nuage de points.

L'existence d'une corrélation se visualise par l'alignement plus ou moins prononcé des points près de la droite.

La faiblesse d'une corrélation se visualise par une dispersion du nuage de points.

Dans le graphique ci-dessus, on voit qu'il y a une corrélation, car on pourrait tracer une droite des moindres carrés qui passerait près de tous les points du graphique.

Cette corrélation est positive : le taux de chômage de longue durée (dans le total du chômage) varie dans le même sens que le degré de la protection de l'emploi. Plus le degré de protection de l'emploi est élevé, plus le taux de chômage de longue durée (dans le total du chômage) est élevé.

II

Interpréter des corrélations

A

Les causalités

Causalité

Une causalité est une corrélation dans laquelle une variable dépend de l'autre et cette relation persiste dans le temps.

Si on observe sur une longue période que plus la quantité travaillée augmente, plus le salaire augmente (puisque chaque heure supplémentaire travaillée est payée) alors il y a un lien de causalité entre le nombre d'heures travaillées et le salaire.

Si deux variables varient dans le même sens ou dans le sens contraire, sans qu'il n'y ait de lien entre les deux, on dit qu'il y a corrélation sans causalité.

B

Sens de la causalité

Une fois que l'on a établi le lien de causalité entre deux variables, il faut définir le sens de la causalité, c'est-à-dire si :

  • Le lien logique est de la variable A vers la variable B ou de la variable B vers la variable A.
  • Définir quelle est la variable expliquée et quelle est la variable explicative.

Dans le lien de causalité entre le nombre d'heures travaillées et le salaire d'un ouvrier, le lien logique est :

  • Du nombre d'heures travaillées vers le salaire : c'est parce que l'ouvrier a travaillé plus d'heures qu'il gagne plus.
  • La variable explicative est donc le nombre d'heures travaillées et la variable expliquée est le salaire.